Meta giới thiệu mô hình ngôn ngữ Llama 3: model AI mạnh nhất hiện tại

Phiên bản mới nhất của mô hình ngôn ngữ của Meta, Llama 3, đã chính thức ra mắt với hai phiên bản khác nhau: một có 8 tỷ tham số và một có 70 tỷ tham số. Llama 3 được Meta cải thiện về khả năng suy luận và hiệu suất tổng thể, vượt trội so với Llama 2 và một số mô hình ngôn ngữ khác trên thang đo mới. Meta thông báo rằng Llama 3 sẽ được triển khai sớm và sử dụng ít tài nguyên hơn Llama 2, mặc dù có số lượng tham số lớn hơn.
Llama 3 đã được đào tạo dựa trên hơn 15 nghìn tỷ token từ nguồn dữ liệu công cộng, với việc sử dụng bộ lọc dữ liệu chất lượng cao và một tập hợp dữ liệu đa ngôn ngữ. Mô hình này được tối ưu hóa cho các tình huống thực tế thông qua việc áp dụng bộ điểm chuẩn mới.
Trong bài kiểm tra điểm chuẩn (benchmark) do Meta thực hiện, Llama 3 Instruct với 8 tỷ tham số (8B) đã vượt trội hơn so với Mistral 7B và Gemma 7B. Trong khi đó, phiên bản Llama 3 70B vượt trội hơn so với Gemini 1.5 Pro và Claude 3 Sonnet. Đáng chú ý là trong bài kiểm tra HumanEval (Human Evaluation) – các bài kiểm tra đánh giá “tính người” của các mô hình, Llama 3 cũng vượt trội so với Claude Sonnet, Mistral Medium và GPT-3.5.
Ngoài hai phiên bản hiện có, Meta cũng đang phát triển một phiên bản Llama 3 khác với 400 tỷ tham số, tuy nhiên phiên bản này vẫn chưa được mở mã nguồn do đang trong quá trình huấn
Ngoài hai phiên bản hiện có, Meta vẫn đang phát triển một phiên bản Llama 3 khác với 400 tỷ tham số. Tuy nhiên, phiên bản này vẫn chưa được mở mã nguồn và đang trong quá trình huấn luyện.
Một điểm đáng chú ý trên Llama 3 là việc giảm tỉ lệ từ chối trả lời các mẫu prompt nhạy cảm, ví dụ như cách chia tay với một người nào đó, và giảm việc từ chối các từ khoá nhạy cảm, đặt chúng vào bối cảnh của người hỏi. Hiện tại, Llama 3 là một mô hình ngôn ngữ dựa trên văn bản thuần tuý, nhưng Meta mong muốn phát triển nó thành một mô hình ngôn ngữ đa phương thức và đa ngôn ngữ.
Llama 3 tích hợp các công cụ an toàn và bảo mật mới như Llama Guard 2, Cybersec Eval 2 và Code Shield để lọc mã không an toàn. Meta cũng đang phát triển torchtune, một thư viện PyTorch-native, để hỗ trợ việc tạo và điều chỉnh mô hình LLM một cách dễ dàng. Llama 3 không chỉ là một bước tiến trong lĩnh vực AI của Meta mà còn là một nền tảng mở cho cộng đồng phát triển và triển khai các ứng dụng AI một cách có trách nhiệm. Điều này phản ánh cam kết dài hạn của Meta trong việc phát triển một hệ sinh thái AI mở và an toàn.
Bạn có thể trải nghiệm Llama 3 tại đây hoặc tải model về qua LM Studio trên Hugging Face. Mặc dù Llama 3 có thể là mô hình AI mạnh nhất hiện tại, nhưng trong tương lai gần, với sự ra mắt của GPT-5 và Gemini 1.5 Ultra, cũng như Sora AI của OpenAI, cuộc đua trong lĩnh vực các mô hình AI vẫn tiếp tục nóng bỏng. Tuy nhiên, Mark Zuckerberg đã cho biết rằng, Meta đã bắt đầu “nghĩ về Llama 4 và Llama 5”.

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *