66B là một mô hình ngôn ngữ có khoảng 66 tỷ tham số, được thiết kế để xử lý ngôn ngữ tự nhiên ở nhiều ngôn ngữ và tác vụ. Mô hình được xây dựng trên khung học sâu với nhiều tầng tự chú ý và lớp xử lý dữ liệu nhằm nắm bắt ngữ cảnh dài. Việc có số tham số lớn cho phép mô hình ghi nhớ kiến thức rộng và khả năng suy luận phức tạp, nhưng đồng thời đòi hỏi nguồn tài nguyên tính toán và dữ liệu có chất lượng cao.
Về kích thước, 66B cho thấy khả năng nắm bắt ngữ nghĩa và mối quan hệ ngữ cảnh ở mức độ sâu. Kiến trúc phân cấp cho phép xử lý nội dung từ câu ngắn đến văn bản dài, với nhiều lớp ghép ghép trọng số ở mỗi cấp. Các kỹ thuật tối ưu hoá và phân phối trọng số giúp triển khai trên phần cứng giới hạn mà vẫn duy trì hiệu suất tốt.
66B có thể thực hiện trả lời câu hỏi, viết văn bản sáng tạo, tóm tắt và hỗ trợ lập trình ở mức khá ấn tượng. Tuy nhiên, nó còn đối mặt với các thách thức như thiên lệch dữ liệu, rủi ro sinh thông tin không chính xác và yêu cầu đánh giá đầu ra liên tục trong các hệ thống thực tế. An toàn và minh bạch cần được tích hợp trong toàn bộ vòng đời triển khai.
Quá trình huấn luyện cho 66B đòi hỏi tập dữ liệu lớn từ nhiều nguồn khác nhau như sách, bài báo, trang web và đối thoại. Quá trình lọc và làm sạch dữ liệu nhằm giảm thiểu nội dung gây hại và bảo vệ quyền riêng tư là yếu tố quan trọng. Việc tuân thủ bản quyền và đa ngôn ngữ giúp mô hình phát huy khả năng ở nhiều ngữ cảnh khác nhau.
