Notifications
Clear all

Cách đào tạo Generative AI với dữ liệu công ty của bạn

1 Posts
1 Users
0 Likes
578 Views
(@hungtran0609)
Estimable Member
Joined: 2 years ago
Posts: 36
Topic starter  

ChatGPT và các mô hình hình ảnh hoặc ngôn ngữ lớn khác đang được nhiều công ty thử nghiệm. Khả năng diễn đạt những ý tưởng phức tạp bằng ngôn ngữ rõ ràng của họ thường được coi là đáng kinh ngạc. Tuy nhiên, hầu hết người dùng đều biết rằng các hệ thống này chủ yếu được đào tạo về thông tin dựa trên internet và không thể trả lời các lời nhắc hoặc câu hỏi về nội dung hoặc kiến ​​thức độc quyền.

Dữ liệu và kiến thức tổ chức rất quan trọng đối với khả năng cạnh tranh, nhưng tổ chức và triển khai hiệu quả là một thách thức.

Trong môi trường đầy biến động ngày nay, việc tận dụng tri thức độc quyền của công ty là rất quan trọng đối với khả năng cạnh tranh và đổi mới của công ty. Đổi mới tổ chức dựa trên sự sáng tạo, quản lý, ứng dụng, tái kết hợp và triển khai hiệu quả và linh hoạt các tài sản tri thức và bí quyết. Tuy nhiên, tri thức trong các tổ chức thường được tạo ra và nắm bắt từ nhiều nguồn và hình thức khác nhau, khiến cho việc tổ chức và triển khai hiệu quả trở nên khó khăn.

Các mô hình AI với ngôn ngữ và hình ảnh lớn nâng cao khả năng quản lý tri thức và hiệu suất của công ty.

Sự xuất hiện của các mô hình AI tạo ra ngôn ngữ và hình ảnh lớn mang đến những cơ hội mới để quản lý tri thức, nâng cao hiệu suất, khả năng học tập và đổi mới của công ty. Chẳng hạn, một nghiên cứu được thực hiện tại một nhà cung cấp phần mềm quy trình kinh doanh trong danh sách Fortune 500 đã chứng minh rằng một hệ thống hỗ trợ khách hàng dựa trên trí tuệ nhân tạo AI giúp tăng năng suất của các đại lý hỗ trợ, cải thiện khả năng giữ chân khách hàng và phản hồi tích cực hơn từ khách hàng. Hơn nữa, hệ thống tạo điều kiện thuận lợi cho việc học tập và phát triển kỹ năng của các đại lý mới làm quen.

Các tổ chức sử dụng các mô hình ngôn ngữ lớn tiếp cận vốn trí tuệ và kiến ​​thức.

Giống như công ty đã nói ở trên, ngày càng có nhiều tổ chức đang cố gắng tận dụng các kỹ năng xử lý ngôn ngữ và khả năng suy luận chung của các mô hình ngôn ngữ lớn (LLM) để cung cấp khả năng tiếp cận nội bộ hoặc khách hàng rộng rãi đối với vốn tri thức của họ. Các mô hình này được sử dụng để thông báo cho nhân viên làm việc trực tiếp với khách hàng về các chính sách của công ty và đề xuất sản phẩm/dịch vụ, giải quyết các vấn đề về dịch vụ khách hàng hoặc nắm bắt kiến ​​thức của nhân viên trước khi họ rời khỏi tổ chức.

Trí tuệ nhân tạo khơi dậy khả năng quản lý tri thức.

Các mục tiêu đề cập ở trên cũng được theo đuổi trong phong trào "quản lý tri thức" vào những năm 1990 và đầu những năm 2000, nhưng công nghệ có sẵn vào thời điểm đó được coi là không đủ cho nhiệm vụ này. Ngày nay, AI Tạo sinh khơi dậy khả năng nắm bắt và phổ biến kiến ​​thức quan trọng trong toàn tổ chức và vượt ra ngoài ranh giới của tổ chức  . Như một người quản lý sử dụng AI Tạo sinh cho mục đích này đã nói: "Tôi cảm thấy như một bộ phản lực vừa xuất hiện trong cuộc đời mình." Bất chấp những tiến bộ hiện tại, một số thách thức gây khó khăn cho việc quản lý tri thức trong quá khứ vẫn còn tồn tại.

Ba cách tiếp cận để kết hợp kiến ​​thức chuyên ngành vào LLM.

Công nghệ quản lý kiến ​​thức dựa trên AI sáng tạo Công nghệ kết hợp kiến ​​thức miền cụ thể của một tổ chức vào LLM đang phát triển nhanh chóng. Hiện tại, có ba cách tiếp cận chính để tích hợp nội dung độc quyền vào một mô hình tổng quát.

  • Đào tạo mô hình từ đầu:
    Một cách tiếp cận liên quan đến việc tạo và đào tạo một mô hình dành riêng cho miền từ đầu. Tuy nhiên, cách tiếp cận này không phổ biến do cần có một lượng lớn dữ liệu chất lượng cao để đào tạo một mô hình ngôn ngữ lớn. Ngoài ra, nó đòi hỏi sức mạnh tính toán đáng kể và chuyên môn về khoa học dữ liệu được đào tạo bài bản, điều mà hầu hết các công ty đều thiếu.

  • Tinh chỉnh mô hình hiện có:
    Chẳng hạn, Bloomberg đã sử dụng phương pháp này bằng cách phát triển BloombergGPT cho nội dung dành riêng cho tài chính và giao diện ngôn ngữ tự nhiên với thiết bị đầu cuối dữ liệu của mình. Tận dụng dữ liệu tài chính, tin tức, tài liệu và văn bản có giá trị hơn 40 năm từ hồ sơ tài chính và internet, các nhà khoa học dữ liệu của Bloomberg đã dành nhiều nguồn lực để tạo ra mô hình. Tuy nhiên, các tài nguyên như vậy không có sẵn cho hầu hết các công ty.

  • Tinh chỉnh mô hình hiện có thông qua lời nhắc:
    Một cách tiếp cận khác liên quan đến việc "tinh chỉnh" một LLM hiện có để kết hợp nội dung miền cụ thể vào một mô hình đã được đào tạo về kiến ​​thức chung và tương tác dựa trên ngôn ngữ. Cách tiếp cận này yêu cầu điều chỉnh các tham số nhất định của mô hình cơ sở và thường yêu cầu ít dữ liệu và thời gian tính toán hơn đáng kể so với đào tạo mô hình từ đầu.

Google đã tinh chỉnh LLM về kiến ​​thức y khoa với những kết quả đầy hứa hẹn.

Google đã sử dụng tinh chỉnh để huấn luyện mô hình Med-PaLM2 của mình về kiến ​​thức y tế. Họ bắt đầu với PaLM2 LLM chung của Google và đào tạo lại nó bằng cách sử dụng kiến ​​thức y tế được tuyển chọn cẩn thận. Mô hình kết quả cho thấy sự cải thiện đáng kể. Tuy nhiên, cần đánh giá và cải thiện thêm trước khi áp dụng nó vào thực hành lâm sàng.

Tinh chỉnh tiết kiệm chi phí nhưng vẫn cần có chuyên môn.

Mặc dù việc tinh chỉnh đòi hỏi ít thời gian và sức mạnh tính toán hơn so với đào tạo LLM từ đầu, nhưng nó vẫn có thể tốn kém đối với nhiều công ty. Nó cũng đòi hỏi chuyên môn khoa học dữ liệu đáng kể. Một số ý kiến ​​cho rằng tinh chỉnh phù hợp nhất để thêm các định dạng và kiểu nội dung mới hơn là giới thiệu nội dung mới.

Điều chỉnh kịp thời là một cách tiếp cận hiệu quả về mặt tính toán để tùy chỉnh LLM.

Cách tiếp cận phổ biến nhất để tùy chỉnh nội dung của LLM trong các công ty cung cấp dịch vụ không phải đám mây liên quan đến việc điều chỉnh nhanh chóng. Cách tiếp cận này đòi hỏi phải giữ cố định mô hình ban đầu và sửa đổi nó thông qua các lời nhắc trong cửa sổ ngữ cảnh có chứa kiến ​​thức về miền cụ thể. Sau khi điều chỉnh kịp thời, mô hình có khả năng trả lời các câu hỏi liên quan đến kiến ​​thức đó. Đây là cách tiếp cận hiệu quả nhất về mặt tính toán trong ba cách tiếp cận và không yêu cầu lượng dữ liệu lớn để đào tạo trong một miền nội dung mới.

Morgan Stanley đã sử dụng phương pháp điều chỉnh kịp thời để nâng cao khả năng tiếp cận kiến ​​thức cho các cố vấn tài chính.

Morgan Stanley đã sử dụng tính năng điều chỉnh nhanh chóng để đào tạo mô hình GPT-4 của OpenAI bằng cách sử dụng một bộ tài liệu được tuyển chọn cẩn thận chứa kiến ​​thức kinh doanh và đầu tư quan trọng. Mục tiêu là cung cấp cho các cố vấn tài chính của công ty kiến ​​thức chính xác và dễ tiếp cận. Hệ thống được đào tạo nhanh chóng hoạt động trong một đám mây riêng dành riêng cho nhân viên của Morgan Stanley.

Điều chỉnh kịp thời đòi hỏi phải quản lý dữ liệu phi cấu trúc và kiến ​​thức chuyên môn.

Mặc dù việc điều chỉnh kịp thời tương đối đơn giản đối với các tổ chức, nhưng nó lại gây ra những thách thức kỹ thuật. Quản lý dữ liệu phi cấu trúc và tạo vectơ nhúng là cần thiết để nhập dữ liệu vào mô hình. Quá trình này đòi hỏi chuyên môn khoa học dữ liệu quan trọng đối với hầu hết các công ty.

Morningstar sử dụng hiệu quả chi phí điều chỉnh nhanh chóng cho công cụ nghiên cứu của mình.

Morningstar đã sử dụng điều chỉnh tức thì và nhúng véc tơ cho công cụ nghiên cứu Mo của mình, công cụ này kết hợp hơn 10.000 phần nghiên cứu của Morningstar. Chỉ sau một tháng làm việc, Morningstar đã giúp Mo tiếp cận được với các cố vấn tài chính và khách hàng là nhà đầu tư độc lập của họ. Phương pháp tiếp cận kỹ thuật tỏ ra tiết kiệm chi phí và hiệu quả.

Quản lý nội dung và quản trị con người là điều cần thiết để quản lý tri thức AI Tạo sinh.

Quản lý và quản lý nội dung Tương tự như các hệ thống quản lý tri thức truyền thống như Microsoft Sharepoint, AI Tạo sinh yêu cầu nội dung chất lượng cao trước khi tùy chỉnh LLM. Trong một số trường hợp, cơ sở dữ liệu kiến ​​thức được quản lý đã tồn tại, như đã thấy với hệ thống Google Med-PaLM2. Mặt khác, các công ty dựa vào sự giám tuyển của con người để đảm bảo tính chính xác, kịp thời và tránh trùng lặp. Ví dụ: Morgan Stanley tuyển dụng các nhà quản lý tri thức ở Philippines, những người liên tục đánh giá các tài liệu dựa trên nhiều tiêu chí để xác định tính phù hợp của chúng để kết hợp vào hệ thống GPT-4. Các công ty không có nội dung được quản lý tốt có thể gặp phải những thách thức về vấn đề này.

Đào tạo và hướng dẫn giúp đảm bảo nội dung kiến ​​thức chất lượng cao.

Duy trì kiến ​​thức chất lượng cao trở nên dễ dàng hơn khi tác giả nội dung hiểu cách tạo tài liệu hiệu quả. Tại Morgan Stanley, các tác giả nội dung trải qua hai khóa học: một khóa học về công cụ quản lý tài liệu và khóa học khác về viết và gắn thẻ tài liệu. Đây là một phần trong phương pháp quản trị nội dung của công ty, là một phương pháp có hệ thống để nắm bắt và quản lý nội dung kỹ thuật số quan trọng.

Morningstar đào tạo những người sáng tạo nội dung về cách sử dụng các hệ thống AI tổng hợp.

Morningstar dạy cho người sáng tạo nội dung loại nội dung nào hoạt động tốt với hệ thống Mo và loại nội dung nào không. Nội dung được gửi tới một hệ thống quản lý nội dung, sau đó hệ thống này sẽ đưa nội dung đó vào cơ sở dữ liệu vectơ cung cấp mô hình OpenAI.

Đảm bảo chất lượng và giải quyết ảo giác trong AI Tạo sinh.

Đảm bảo chất lượng là rất quan trọng trong việc quản lý nội dung AI Tạo sinh. Các mô hình AI sáng tạo đôi khi có thể tạo ra thông tin không chính xác hoặc không tồn tại, được gọi là "ảo giác". Mặc dù các LLM được điều chỉnh về thông tin dành riêng cho miền đã được phát hiện là có ít vấn đề về ảo giác hơn so với các mô hình sẵn dùng, nhưng các cuộc đối thoại mở rộng hoặc lời nhắc phi kinh doanh vẫn có thể gây ra những thách thức.

Các chiến lược đánh giá để quản lý tri thức AI Tạo sinh.

Các công ty triển khai quản lý tri thức AI Tạo sinh nên phát triển một chiến lược đánh giá. Tiêu chí đánh giá có thể bao gồm các nhiệm vụ dành riêng cho miền, khả năng suy luận và các nhiệm vụ xử lý ngôn ngữ tự nhiên. Đánh giá nghiêm ngặt đặc biệt quan trọng trong các lĩnh vực mà độ chính xác và an toàn là tối quan trọng.

Quy trình đánh giá các câu hỏi về tài chính và đầu tư của Morgan Stanley.

Độ chính xác là rất quan trọng đối với Morgan Stanley trong việc cung cấp các câu trả lời có độ chính xác cao cho các câu hỏi về tài chính và đầu tư. Trước khi phát hành, các câu trả lời của hệ thống sẽ được đánh giá cẩn thận bởi người đánh giá. Một giai đoạn thử nghiệm liên quan đến 300 cố vấn tài chính sẽ diễn ra sau đó. Quá trình đánh giá liên tục bao gồm kiểm tra hệ thống dựa trên một tập hợp "câu hỏi vàng" với các câu trả lời đúng đã biết.

Cân nhắc về pháp lý và quản trị đối với việc triển khai LLM.

Việc triển khai LLM liên quan đến các vấn đề pháp lý và quản trị phức tạp, chẳng hạn như sở hữu trí tuệ, quyền riêng tư và bảo mật dữ liệu, thành kiến ​​và đạo đức cũng như kết quả sai hoặc không chính xác. Các công ty sử dụng AI Tạo sinh, bao gồm cả quản lý tri thức, nên mời các đại diện hợp pháp tham gia vào quá trình tạo và quản trị các LLM được điều chỉnh. Một số khía cạnh pháp lý, chẳng hạn như ý nghĩa bản quyền của các kết quả đầu ra của LLM, vẫn chưa rõ ràng.

Mối quan tâm về tính bảo mật và các trường hợp riêng tư đối với các hệ thống AI Tạo sinh.

Những lo ngại về tính bảo mật đối với việc truyền bá thông tin nhạy cảm đã khiến một số công ty cấm nhân viên sử dụng LLM. Tuy nhiên, các hệ thống AI Tạo sinh được điều chỉnh với nội dung dành riêng cho miền thường hoạt động trên các phiên bản riêng tư mà công chúng không thể truy cập được. Các biện pháp an toàn bổ sung, chẳng hạn như vô hiệu hóa việc thu thập lịch sử trò chuyện, giải quyết các vấn đề về bảo mật ngay cả trong các hệ thống công cộng.

Các tính năng an toàn và bảo mật nâng cao dành cho LLM.

Để giải quyết các vấn đề về bảo mật và quyền riêng tư, các nhà cung cấp đang cung cấp các tính năng bảo mật và an toàn nâng cao cho các LLM. Các tính năng này bao gồm xóa lời nhắc của người dùng, hạn chế chủ đề và ngăn việc sử dụng đầu vào dữ liệu độc quyền trong các LLM có thể truy cập công khai. Các nhà cung cấp phần mềm doanh nghiệp đang kết hợp "Lớp tin cậy" vào các sản phẩm và dịch vụ của họ để giảm thiểu rủi ro liên quan đến việc triển khai LLM.

Thúc đẩy tính minh bạch và trách nhiệm giải trình trong việc áp dụng AI sáng tạo.

Thúc đẩy tính minh bạch và trách nhiệm giải trình là rất quan trọng để áp dụng thành công các hệ thống quản lý tri thức dựa trên trí tuệ nhân tạo. Các công ty phải nuôi dưỡng một nền văn hóa khuyến khích tính minh bạch và trách nhiệm giải trình để khai thác các cơ hội và quản lý rủi ro liên quan đến các ứng dụng AI sáng tạo trong quản lý tri thức.

Sử dụng hiệu quả các khả năng tổng quát của AI.

Bên cạnh việc thực hiện các chính sách và hướng dẫn, người dùng cần hiểu cách kết hợp an toàn và hiệu quả các khả năng AI Tạo sinh vào các nhiệm vụ của họ để nâng cao hiệu suất và năng suất. Các khả năng AI sáng tạo, chẳng hạn như nhận thức ngữ cảnh và dự đoán dựa trên dữ liệu, có thể hỗ trợ mạnh mẽ cho công việc tri thức, tự động hóa các quy trình tìm kiếm thông tin chuyên sâu và xử lý email thông thường của khách hàng.

Hành vi mong muốn của người dùng hệ thống AI Tạo sinh.

Người dùng nên làm quen với nội dung có sẵn, tạo lời nhắc hiệu quả, hiểu lời nhắc được phép và không được phép, yêu cầu nội dung kiến ​​thức bổ sung, sử dụng phản hồi của hệ thống trong các tương tác và tạo nội dung mới theo cách hữu ích. Người tạo nội dung có thể được đào tạo về cách tạo và gắn thẻ nội dung cũng như hiểu sự phù hợp của nội dung đối với việc sử dụng AI Tạo sinh.

Sự phát triển nhanh chóng của công nghệ AI tổng hợp.

Lĩnh vực AI Tạo sinh đang phát triển nhanh chóng, với các mô hình mới, cách tiếp cận điều chỉnh và các sản phẩm của nhà cung cấp xuất hiện thường xuyên. Các công ty triển khai quản lý tri thức AI Tạo sinh nên chuẩn bị để điều chỉnh cách tiếp cận của họ thường xuyên trong những năm tới.

Lợi ích của việc kết hợp trí tuệ nhân tạo trong quản lý tri thức lớn hơn những thách thức.

Bất chấp những thách thức liên quan, lợi ích tổng thể của việc kết hợp các hệ thống AI Tạo sinh được đào tạo dựa trên nội dung kiến ​​thức của công ty lớn hơn nỗ lực cần thiết để giải quyết những thách thức này. Tầm nhìn dài hạn về việc cho phép nhân viên và khách hàng dễ dàng tiếp cận kiến ​​thức quan trọng để nâng cao năng suất và đổi mới là một động lực mạnh mẽ. AI sáng tạo dường như là công nghệ cuối cùng có thể biến tầm nhìn này thành hiện thực.

(Theo Tom Davenport - Giáo sư CNTT và Quản lý tại Đại học Babson, nghiên cứu viên tại Trung tâm Kinh doanh Kỹ thuật số MIT, đồng sáng lập Viện Phân tích Quốc tế và Cố vấn Cấp cao của Deloitte Analytics)


   
Quote
Share: