Công ty khởi nghiệp Mistral AI có trụ sở tại Pháp đã bổ sung một mô hình ngôn ngữ lớn (Large Language Model – LLM) độc quyền mới vào thị trường AI ngày càng đông đúc – tuyên bố Mistral Large mới của họ có thể giúp một số đối thủ cạnh tranh lớn cạnh tranh với tiền của họ.
Trong một bài đăng ngày 26 tháng 2, công ty có trụ sở tại Paris lưu ý rằng Mistral Large vượt trội hơn một số LLM đáng chú ý ngoại trừ GPT-4 trong bài kiểm tra “hiểu ngôn ngữ đa nhiệm” và thực hiện mạnh mẽ trong một số bài kiểm tra toán và mã hóa.
Tuy nhiên, hiệu suất của Mistral Large không được so sánh với các sản phẩm như Grok của xAI và Gemini Ultra của Google, được phát hành lần lượt vào tháng 11 năm ngoái và đầu tháng 2.
Guillaume Lample, người sáng lập và nhà khoa học trưởng của công ty, tuyên bố Mistral Large “vượt trội hơn rất nhiều” so với các mô hình trước đó của Mistral AI. Mistral AI cũng giới thiệu “Le Chat” – giao diện trò chuyện AI trên các mô hình của nó – tương tự như cách ChatGPT được xây dựng trên GPT-3.5 và GPT-4.
Công ty đã nhận được 487 triệu USD tài trợ vào tháng 12 từ Nvidia, Salesforce và Andreessen Horowitz, lưu ý rằng Mistral Large biết hơn 20,000 từ tiếng Anh và cũng thông thạo tiếng Pháp, tiếng Tây Ban Nha, tiếng Đức và tiếng Ý.
Trong khi mô hình đầu tiên của Mistral AI được phát hành theo giấy phép nguồn mở thì Mistral Large là một mô hình đóng, độc quyền, tương tự như các LLM mới nhất do OpenAI phát hành, dẫn đến sự thất vọng từ một số nhà quan sát về X.
Trong khi các nền tảng xếp hạng chatbot AI của bên thứ ba như Chatbot Arena chưa đánh giá Mistral Large, thì mô hình Mistral Medium trước đó của nó đứng thứ sáu trong danh sách hơn 60 LLM.
Hàng nghìn xếp hạng theo cặp của Chatbot Arena được xử lý thông qua mô hình Bradley-Terry, sử dụng mẫu ngẫu nhiên để tạo ra xếp hạng “Elo”, ước tính mô hình nào có nhiều khả năng giành chiến thắng nhất trong cuộc cạnh tranh trực tiếp với mô hình khác.
Công ty gần đây cũng đã công bố quan hệ đối tác với Microsoft, điều này sẽ giúp Mistral Large có thể truy cập được trên Azure AI Studio và Azure Machine Learning.
Mistral AI nói về LLM tập trung vào thương mại của mình: “Niềm tin của Microsoft đối với mô hình của chúng tôi là một bước tiến trong hành trình của chúng tôi”.
Mistral Large sẽ khai thác “cơ sở hạ tầng siêu máy tính” của Azure cho mục đích đào tạo và mở rộng quy mô, đồng thời hai công ty cũng sẽ hợp tác nghiên cứu và phát triển AI theo tuyên bố ngày 26 tháng 2 của Eric Boyd, phó chủ tịch tập đoàn Nền tảng AI Azure của Microsoft.
Mistral Large có giá 8 USD cho một triệu token đầu vào và 24 USD cho mỗi triệu token đầu ra, khiến nó chỉ rẻ hơn một chút so với GPT-4 Turbo ở mức lần lượt là 10 USD và 30 USD. Theo Bloomberg, Mistral được định giá gần 2 tỷ USD vào tháng 12 năm ngoái.
Trong một bài đăng ngày 26 tháng 2, công ty có trụ sở tại Paris lưu ý rằng Mistral Large vượt trội hơn một số LLM đáng chú ý ngoại trừ GPT-4 trong bài kiểm tra “hiểu ngôn ngữ đa nhiệm” và thực hiện mạnh mẽ trong một số bài kiểm tra toán và mã hóa.
Tuy nhiên, hiệu suất của Mistral Large không được so sánh với các sản phẩm như Grok của xAI và Gemini Ultra của Google, được phát hành lần lượt vào tháng 11 năm ngoái và đầu tháng 2.
Guillaume Lample, người sáng lập và nhà khoa học trưởng của công ty, tuyên bố Mistral Large “vượt trội hơn rất nhiều” so với các mô hình trước đó của Mistral AI. Mistral AI cũng giới thiệu “Le Chat” – giao diện trò chuyện AI trên các mô hình của nó – tương tự như cách ChatGPT được xây dựng trên GPT-3.5 và GPT-4.
Công ty đã nhận được 487 triệu USD tài trợ vào tháng 12 từ Nvidia, Salesforce và Andreessen Horowitz, lưu ý rằng Mistral Large biết hơn 20,000 từ tiếng Anh và cũng thông thạo tiếng Pháp, tiếng Tây Ban Nha, tiếng Đức và tiếng Ý.
Trong khi mô hình đầu tiên của Mistral AI được phát hành theo giấy phép nguồn mở thì Mistral Large là một mô hình đóng, độc quyền, tương tự như các LLM mới nhất do OpenAI phát hành, dẫn đến sự thất vọng từ một số nhà quan sát về X.
Trong khi các nền tảng xếp hạng chatbot AI của bên thứ ba như Chatbot Arena chưa đánh giá Mistral Large, thì mô hình Mistral Medium trước đó của nó đứng thứ sáu trong danh sách hơn 60 LLM.
Hàng nghìn xếp hạng theo cặp của Chatbot Arena được xử lý thông qua mô hình Bradley-Terry, sử dụng mẫu ngẫu nhiên để tạo ra xếp hạng “Elo”, ước tính mô hình nào có nhiều khả năng giành chiến thắng nhất trong cuộc cạnh tranh trực tiếp với mô hình khác.
Công ty gần đây cũng đã công bố quan hệ đối tác với Microsoft, điều này sẽ giúp Mistral Large có thể truy cập được trên Azure AI Studio và Azure Machine Learning.
Mistral AI nói về LLM tập trung vào thương mại của mình: “Niềm tin của Microsoft đối với mô hình của chúng tôi là một bước tiến trong hành trình của chúng tôi”.
Mistral Large sẽ khai thác “cơ sở hạ tầng siêu máy tính” của Azure cho mục đích đào tạo và mở rộng quy mô, đồng thời hai công ty cũng sẽ hợp tác nghiên cứu và phát triển AI theo tuyên bố ngày 26 tháng 2 của Eric Boyd, phó chủ tịch tập đoàn Nền tảng AI Azure của Microsoft.
Mistral Large có giá 8 USD cho một triệu token đầu vào và 24 USD cho mỗi triệu token đầu ra, khiến nó chỉ rẻ hơn một chút so với GPT-4 Turbo ở mức lần lượt là 10 USD và 30 USD. Theo Bloomberg, Mistral được định giá gần 2 tỷ USD vào tháng 12 năm ngoái.