99% Người Mới Bắt Đầu Sẽ Không Biết Những Điều Cơ Bản Này Về AI

 Tuần trước, tôi đã dành 5 giờ đồng hồ và 49 đô la để hoàn thành khóa học "AI Essentials" (Những điều cốt yếu về AI) mới nhất của Google dành cho người mới bắt đầu. Nên tôi muốn viết bài này để chia sẻ 5 điểm chính rút ra từ khóa học, những ưu và nhược điểm, từ bài học này

Điểm rút ra số một: Nhìn chung, có ba loại công cụ AI hiện nay.

Công cụ độc lập (Standalone tools): 

Đây là những phần mềm được hỗ trợ bởi AI, được thiết kế để hoạt động độc lập với thiết lập tối thiểu. Loại này bao gồm các chatbot đa năng như ChatGPT, Gemini, Claude Perplexity, cũng như các ứng dụng chuyên biệt như Spico, Otter AI, Midjourney Gamma. Mặc dù phục vụ các nhu cầu hoàn toàn khác nhau, tất cả các công cụ này được phân loại là độc lập vì chúng có thể được truy cập trực tiếp qua trang web hoặc ứng dụng của chúng và có thể sử dụng mà không cần tích hợp với phần mềm khác.

Công cụ có tính năng AI tích hợp (Tools with integrated AI features): 

Điều này trái ngược với loại thứ nhất, dùng để chỉ các cải tiến được tích hợp sẵn trong một phần mềm cụ thể. Ví dụ, sau khi soạn thảo một bài đăng trong Google Docs, tôi có thể sao chép và dán văn bản này vào một ứng dụng độc lập như ChatGPT để cải thiện bài viết của mình, hoặc tôi có thể sử dụng tính năng AI tích hợp Gemini cho Workspace để thực hiện các điều chỉnh. 

Một ví dụ khác là tôi có thể sử dụng Midjourney như một công cụ độc lập để tạo hình ảnh cho bài thuyết trình, hoặc tôi có thể tạo hình ảnh trực tiếp trong Google Slides bằng cách sử dụng, một lần nữa, Gemini cho Workspace. Trong những trường hợp này, ChatGPT và Midjourney là các công cụ AI độc lập, còn Google Docs và Google Slides là các công cụ có tính năng AI tích hợp.

Giải pháp AI tùy chỉnh (Custom AI solution): 

Đây là một ứng dụng được thiết kế riêng để giải quyết một vấn đề cụ thể. Ví dụ, Đại học Johns Hopkins đã phát triển một hệ thống AI với mục tiêu duy nhất là phát hiện nhiễm trùng huyết (sepsis). Giải pháp AI tùy chỉnh này đã cải thiện độ chính xác chẩn đoán từ 2-5% lên mức trung bình 40%. Và nếu bạn giống tôi, không có nền tảng kỹ thuật, bạn có thể nghĩ: "Ồ, các giải pháp AI tùy chỉnh cực kỳ phức tạp về mặt kỹ thuật và tôi có lẽ sẽ không bao giờ phải sử dụng chúng ở nơi làm việc." 

Thực tế thì ngược lại, bởi vì các giải pháp AI tùy chỉnh được thiết kế tốt sẽ đòi hỏi ít hoặc không cần người có kiến thức kỹ thuật. Ví dụ, khi tôi còn ở trong đội ngũ bán hàng, tôi quản lý hơn 200 khách hàng mỗi quý và việc nghiên cứu từng người rõ ràng rất tốn thời gian. Ngày nay, có những giải pháp AI tùy chỉnh có thể thu thập tất cả thông tin về 200 khách hàng đó, tính đến các yếu tố như tính thời vụ, dữ liệu lịch sử và xu hướng ngành, rồi xếp hạng những khách hàng đó theo khả năng họ cần hỗ trợ, giúp nhân viên bán hàng ưu tiên thời gian của họ.

Quay lại với những điểm tôi rút ra số 2 sau buổi học

Điểm học được thứ hai từ khóa học là một mẹo về kỹ thuật tạo câu lệnh (prompt engineering): làm nổi bật bối cảnh ngầm định (surface the implied context).

Để minh họa điều này, hãy tưởng tượng một người bạn ăn chay của bạn nhờ bạn gợi ý nhà hàng. Bạn sẽ theo bản năng trả lời bằng các lựa chọn phù hợp với người ăn chay, ngay cả khi bạn của bạn không nói rõ ràng: "Này đồ ngốc, nhớ là phải đồ chay nhé." Ở đây, việc bạn của bạn là người ăn chay chính là bối cảnh ngầm định và cần được nêu rõ ràng khi giao tiếp với các công cụ AI như ChatGPT và Google Gemini.

99% Người Mới Bắt Đầu Sẽ Không Biết Những Điều Cơ Bản Này Về AI

Một ví dụ khác có thể là bạn đang chuẩn bị đàm phán tăng lương với sếp. Trong đầu bạn biết rằng năm ngoái bạn đã được tăng 10%, năm nay bạn là người có thành tích cao nhất trong nhóm và mức tăng trung bình của ngành là 12%, vì vậy bạn quyết định yêu cầu tăng 15%. Nếu bạn bỏ qua tất cả bối cảnh ngầm định đó khi động não về các kỹ thuật đàm phán với một công cụ AI, bạn sẽ nhận được kết quả chất lượng thấp hơn, tức là chung chung hơn. 

Điểm rút ra số ba: biết khi nào nên sử dụng phương pháp tạo câu lệnh zero-shot và few-shot.

Tóm lại, từ "shot" đơn giản có nghĩa là "ví dụ".

Zero-shot (Không ví dụ): nghĩa là bạn sử dụng một câu lệnh không có ví dụ nào.

One-shot (Một ví dụ): nghĩa là bạn cung cấp một ví dụ.

Few-shot (Vài ví dụ): nghĩa là bạn cung cấp hai hoặc nhiều ví dụ.

Ví dụ, một câu lệnh zero-shot có thể trông giống như: "Viết cho tôi một câu làm quen cho Bumble." (Đây là một kịch bản hoàn toàn giả định, tôi sẽ không bao giờ chấp nhận, chứ đừng nói là tham gia.)

Một câu lệnh one-shot sẽ là: "Viết cho tôi một câu làm quen cho Bumble, tham khảo câu làm quen này mà bạn tôi đã sử dụng và có hiệu quả," và bạn đưa vào một ví dụ về những gì bạn của bạn đã viết.

Một câu lệnh few-shot sẽ trông giống như one-shot, chỉ khác là có hai hoặc nhiều ví dụ về những câu làm quen thành công.

Và như bạn có thể tưởng tượng, bạn càng cung cấp nhiều ví dụ liên quan cho công cụ AI, kết quả đầu ra sẽ càng pertinente (phù hợp/liên quan).

Điểm rút ra số bốn: sử dụng phương pháp tạo câu lệnh theo chuỗi suy nghĩ (Chain of Thought prompting) cho các tác vụ phức tạp.

Khi bạn chia một tác vụ duy nhất thành các bước dễ quản lý hơn, bạn giúp mô hình ngôn ngữ lớn tạo ra kết quả chính xác và nhất quán."

Một ví dụ thực tế dễ liên tưởng là viết thư xin việc.

Lựa chọn một: Bạn chia sẻ sơ yếu lý lịch hiện tại của mình và mô tả công việc với chatbot và chỉ cần yêu cầu nó viết cho bạn một lá thư xin việc.

Lựa chọn hai (với Chain of Thought prompting): Bạn chia nhỏ tác vụ lớn (viết toàn bộ thư xin việc) thành các bước dễ quản lý.

Bước một: "Dựa trên sơ yếu lý lịch của tôi và mô tả công việc, hãy viết một đoạn mở đầu thu hút sự chú ý cho thư xin việc của tôi."

Sau đó, sau khi thực hiện một vài chỉnh sửa nhỏ cho đoạn mở đầu, bước hai sẽ là dán lại đoạn đó vào chatbot và yêu cầu nó viết đoạn thân bài.

Lặp lại quy trình tương tự cho đoạn kết bài.

Điểm rút ra số năm là một chủ đề mà nhiều người trong chúng ta, bao gồm cả tôi, có xu hướng bỏ qua khi sử dụng các công cụ AI: đó là hiểu những hạn chế của AI.

Nhìn chung, có ba hạn chế chính:

Dữ liệu nền tảng (underlying data) được sử dụng để huấn luyện các mô hình AI có thể bị thiên vị (biased). Nếu một mô hình chuyển văn bản thành hình ảnh chỉ được huấn luyện trên đồ họa tối giản, nó có thể không tạo ra được các thiết kế hào nhoáng và táo bạo.

Đơn giản là không có đủ thông tin trong dữ liệu huấn luyện nguồn về một chủ đề nhất định. Nhiều mô hình AI có một "ngày giới hạn thông tin" (cutoff date), vì vậy nếu bạn hỏi về điều gì đó xảy ra gần đây, nó sẽ không có đủ dữ liệu về chủ đề đó để cung cấp cho bạn câu trả lời chính xác.

Cuối cùng, "ảo giác" (hallucinations) là các kết quả đầu ra của AI hoàn toàn không chính xác về mặt thực tế. Đôi khi đây là một tính năng chứ không phải là lỗi, ví dụ như khi bạn đang động não ý tưởng mới. Những lúc khác, ảo giác lại lan truyền thông tin sai lệch, vì vậy bạn chắc chắn muốn kiểm tra kỹ câu trả lời của mình đối với những gì tôi gọi là "các tác vụ có tính rủi ro cao" (high-stake tasks) – ví dụ, loại thực phẩm bổ sung hoặc vitamin nào nên dùng dựa trên mục tiêu sức khỏe của bạn.

Nhận xét

Bài đăng phổ biến từ blog này

Những Đường Chỉ Tay có thể Báo Hiệu Trúng Số Trong Lòng Bàn Tay

Điều Gì Sẽ Xảy Ra Khi Bạn Chặt hết Cây Xanh Trong Một Thành Phố?

Tâm lý học của việc suy nghĩ quá mức: Tại sao chúng ta làm vậy và cách dừng lại

Debit Card là gì?

Tìm Hiểu Về AI(Artificial intelligence), ML(machine learnin) và AI tạo sinh (Generative AI)