22 October, 2024

Học về AI: Đã quá sớm hay quá muộn?

Liệu đã quá sớm hay quá muộn để học về AI? Làm thế nào để bắt đầu khám phá, khi mà AI đang không ngừng phát triển?

Học về AI: Đã quá sớm hay quá muộn?
Available in:
 English
 Vietnamese
Reading time: 11 min.
Table of content
  • Tại sao có thể là quá sớm?
  • Tại sao có thể là quá muộn?
  • Quan điểm của mình
  • Làm thế nào để bắt đầu?
  • Yêu cầu về ngoại ngữ
  • Một số thuật ngữ cần biết
  • Tài liệu học tập
  • Kết luận

Mình còn nhớ lần đầu tiên biết đến machine learning vào khoảng năm 2016, khi đó thế giới còn rất khác. Thời đó, trên mạng không có nhiều tài liệu hay hướng dẫn chi tiết. Hầu hết những gì mình tìm thấy đều là những tài liệu kỹ thuật cao siêu, cứ như là công thức toán học ngoài hành tinh vậy! Nhưng giờ đây, lĩnh vực Học Máy - Machine Learning (ML) và Trí tuệ nhân tạo (AI) nói chung đã phát triển rất nhanh. Trên internet cũng có nhiều hướng dẫn dễ hiểu hơn để bắt đầu.

My prediction about AI

Với sự ra đời của ChatGPT vào năm 2022, chúng ta đã bước vào một kỷ nguyên mới của công nghệ AI và các ứng dụng dựa trên mô hình ngôn ngữ lớn - Large language models (LLM). Nó phát triển nhanh đến mức đôi khi mình cần phải đọc tin tức trên LinkedIn mỗi sáng chỉ để theo kịp.

Tuy nhiên, thời buổi này, vẫn có người băn khoăn không biết học AI là quá sớm hay quá muộn. Trong bài viết này, mình sẽ chia sẻ quan điểm cá nhân về vấn đề này.

Tại sao có thể là quá sớm?

Fun image, how to start learning AI

Tốc độ phát triển của AI giờ rất nhanh. Những gì bạn học hôm nay có thể sẽ lỗi thời trong vài tháng tới. Một ví dụ thực tế: LangChain, một framework được sử dụng để kết nối LLM khi các mô hình mã nguồn mở mới xuất hiện vào đầu năm 2023. Giờ đây, nó đã trở nên ít được quan tâm hơn vì hầu hết các API LLM được host sẵn đều cung cấp khả năng gọi công cụ (tool calling). Cái này giống như việc học cách điều khiển xe ngựa ngay khi ô tô đang được phát minh vậy!

Cũng có thể là quá sớm vì một số công nghệ vẫn chưa xuất hiện. Ví dụ, tại thời điểm viết bài blog này, khả năng xử lý hình ảnh mới bắt đầu phổ biến với hầu hết các LLM mã nguồn mở. Tuy nhiên, khả năng về giọng nói vẫn còn khá thử nghiệm. Hiện tại, mô hình "Moshi" của kyutai là mô hình mã nguồn mở duy nhất có thể hiểu và phản hồi bằng giọng nói - thú thật thì nó vẫn nghe giống robot hơn là người.

Tại sao có thể là quá muộn?

Fun image, confusing technical terms

Ngày nay, vì người ta đã phát minh ra đã có rất nhiều công nghệ, nên có rất nhiều thứ phải học nếu bạn là người mới vào ngành AI.

Không chỉ cần hiểu các chi tiết kỹ thuật bên dưới của các kiến trúc machine learning, mà còn cần biết các kỹ thuật phổ biến mà mọi người sử dụng để kết nối mô hình với thế giới bên ngoài. Điều này có thể rất khó nếu bạn chưa theo dõi sát sao những công nghệ mới ra.

Một ví dụ có thể là RAG (Retrieval-augmented generation), cho phép người dùng tái sử dụng một mô hình cơ sở với tệp dữ liệu tùy chỉnh, hiệu quả tạo ra chatbot riêng mà không cần phải train cho nó từ đầu - vốn là một việc rất tốn thời gian và tiền bạc. Tuy nhiên, điều này không chỉ đòi hỏi kiến thức cơ bản về cách LLM hoạt động, mà còn cần biết về các kỹ thuật RAG phổ biến và cách kết nối chúng lại với nhau để tạo ra sản phẩm cuối cùng có thể sử dụng được. Giống như việc không chỉ cần học cách lái xe, mà còn phải biết động cơ hoạt động thế nào, cách bảo dưỡng ra sao, và làm thế nào để điều chỉnh nó cho các mục đích khác nhau.

Quan điểm của mình

Chẳng quá sớm hay quá muộn! Đừng nên đắn đó về việc học các kỹ năng liên quan đến AI. Mình luôn tin rằng AI không phải là một trào lưu nhất thời và nó sẽ là một phần không thể thiếu trong cuộc sống của chúng ta trong tương lai. Giống như internet những năm 90 - một số người nghĩ đó chỉ là mốt nhất thời, nhưng hãy nhìn xem chúng ta đang ở đâu bây giờ!

Hơn nữa, theo mình, nếu có một điều gì đó để học, thì tốt hơn là học nó, dù là quá muộn, còn hơn là không bao giờ. Rốt cuộc, muộn còn hơn không, phải không?

Quan trọng nhất, nếu bạn vẫn đang là sinh viên hoặc đang tích cực tìm kiếm việc làm, có kinh nghiệm về AI và LLM có thể giúp bạn được chú ý nhiều hơn, đặc biệt là nếu bạn đóng góp vào các dự án mã nguồn mở. Để mình chia sẻ một câu chuyện cá nhân: kể từ khi mình trở thành người đóng góp tích cực của llama.cpp, một dự án mã nguồn mở khá nổi tiếng để chạy LLM trên máy tính cá nhân, mình đã nhận được nhiều lời mời làm việc, nhiều người muốn làm việc cùng mình. Và cũng từ đó, may mắn mà mình tìm được công việc hiện tại ở Hugging Face.

Làm thế nào để bắt đầu?

Venn diagram of domains in AI

Ngày nay, chúng ta có nhiều cách để bắt đầu học về AI và LLM. Tuy nhiên, khả năng tiếp cận nhiều tài liệu học tập có thể khiến người học mới cảm thấy bối rối. Để có cái nhìn tốt hơn về lộ trình học tập, trước tiên bạn phải hiểu một số thuật ngữ phổ biến và mối quan hệ giữa chúng.

Yêu cầu về ngoại ngữ

Trong quá trình tìm hiểu, chắc hẳn các bạn sẽ có thể tìm được những tài liệu bằng tiếng Việt một cách không quá khó khăn. Tuy vậy, mình luôn khuyến khích dành thời gian đọc các tài liệu và xem video bằng tiếng Anh. Lý do là bởi vì:

  1. Các công nghệ mới nhất thường sẽ có các bài giới thiệu bằng tiếng Anh trước, sau đó mới có người dịch lại bằng tiếng Việt. Mà ngành AI thì giờ phát triển nhanh lắm. Đợi như vậy, bạn sẽ bỏ lỡ khá nhiều thứ hay.
  2. Giao diện của các nền tảng lớn cũng hỗ trợ tiếng Anh là chủ yếu.
  3. Có nhiều thuật ngữ, như Transformer hay Generative AI, khi dịch sang tiếng Việt sẽ khó mà sát nghĩa được. Điều này có thể sẽ dẫn đến làm bạn hiểu sai.

Một số thuật ngữ cần biết

Trí tuệ nhân tạo (AI) là ý tưởng về một cỗ máy có thể bắt chước trí thông minh của con người. Có nhiều cách để đạt được AI, nhưng cách phổ biến nhất hiện nay là thông qua machine learning. Hãy nhớ đừng nhầm lẫn, AI không phải là machine learning - giống như cách một hình vuông là một hình chữ nhật, nhưng một hình chữ nhật không phải lúc nào cũng là hình vuông!

Machine learning (ML) là một nhánh của AI cho phép máy tính có khả năng học mà không cần được lập trình rõ ràng. Ví dụ, bạn có thể lấy một tập dữ liệu chữ viết tay làm đầu vào cho thuật toán ML, và nó sẽ học các mẫu để phát hiện đó là chữ cái, số nào, v.v. Hãy nghĩ về nó như việc dạy máy tính bằng cách cho xem ví dụ thay vì đưa ra các quy tắc if-else nghiêm ngặt.

Generative AI (hay GenAI) mô tả các thuật toán có thể được sử dụng để tạo nội dung mới, bao gồm âm thanh, mã, hình ảnh, văn bản, mô phỏng và video. Các bạn đọc Việt Nam chú ý, "generation" ở đây nghĩa là "tạo ra cái mới", chứ không phải "thế hệ" như kiểu Gen X,Y,Z đâu nhé!

Mô hình ngôn ngữ lớn (LLM) là các mô hình machine learning có thể hiểu và tạo ra văn bản ngôn ngữ của con người. LLM cũng là một Generative AI. Ví dụ, ChatGPT là một LLM có thể hiểu và phản hồi các yêu cầu được viết bằng ngôn ngữ tự nhiên.

Ngày nay, có nhiều lĩnh vực nghề nghiệp liên quan đến LLM và AI, ví dụ:

  • Prompt engineering: quá trình lặp lại và cải thiện các câu lệnh cho AI, nhằm tăng độ chính xác và hiệu quả của nó
  • Conversational AI Developer: tạo chatbot, trợ lý ảo và hệ thống đối thoại. Đây là nhánh nổi tiếng nhất nếu bạn là người mới, vì nó cho phép bạn thêm các tính năng được hỗ trợ bởi AI vào các ứng dụng hiện có của bạn.
  • Machine Learning Engineer: tập trung vào xây dựng và triển khai các hệ thống machine learning, bao gồm cả LLM. Nói ngắn gọn, những người làm việc trong lĩnh vực này thường train và tối ưu hóa mô hình.
  • AIOps (AI for IT Operations): một cách tiếp cận sử dụng các kỹ thuật trí tuệ nhân tạo và machine learning để tự động hóa và nâng cao hoạt động và quy trình CNTT. Nó có liên quan chặt chẽ đến DevOps.

Tài liệu học tập

Giờ bạn đã có ý tưởng về những gì cần khám phá, hãy xem danh sách tài liệu học tập mình gợi ý sau đây.

Vì nhiều người đọc bài này đến từ nền tảng phát triển web/ứng dụng, hãy tập trung vào những gì có thể áp dụng trong lĩnh vực hiện tại của bạn. Dưới đây là danh sách những gì bạn nên học đầu tiên:

Danh sách trên chỉ đề cập đến chủ đề về LLM và xây dựng chatbot. Nếu bạn muốn khám phá thêm về các mô hình tạo ảnh (image generation), mình khuyên bạn nên xem video này của bycloud để có hiểu biết cơ bản về nó.

Khi đã quen thuộc với các thuật ngữ này, hãy dành thời gian để khám phá về AI mã nguồn mở:

Nếu bạn có nhiều thời gian và muốn đi sâu hơn vào các khái niệm toán học:

Kết luận

Vậy, học AI là quá sớm hay quá muộn? Mình nghĩ chẳng sớm hay muộn - thực ra đây chính là thời điểm thích hợp! Lĩnh vực này đã đủ "rộng" để có tài liệu học tập tốt, nhưng vẫn đủ "mới" để có nhiều chỗ cho người mới tạo dấu ấn của mình.

Hãy nghĩ về nó theo cách này: thời điểm tốt nhất để trồng một cái cây là 20 năm trước, thời điểm tốt thứ hai là ngay bây giờ. Học AI cũng vậy - dù việc bắt đầu sớm hơn có thể tốt, nhưng bắt đầu ngay bây giờ vẫn tốt hơn là không bao giờ bắt đầu.

Hãy nhớ rằng, mọi chuyên gia đều từng là người mới bắt đầu, người đã quyết định thực hiện bước đầu tiên đó. Vậy tại sao không biến hôm nay thành ngày bắt đầu của bạn? Và ai biết được, có thể trong vài tháng nữa, bạn sẽ là người viết một bài blog về hành trình AI của mình!

Want to receive latest articles from my blog?
Follow on
Discussion