Trong thời đại hiện nay, trí tuệ nhân tạo tạo sinh đang phát triển với tốc độ đáng kinh ngạc. Từ khi ChatGPT, Bard, Claude, Midjourney và các công cụ tạo nội dung khác xuất hiện, sự hứng thú và mong đợi đối với trí tuệ nhân tạo tạo sinh đã lan tỏa rộng khắp. Tuy nhiên, các CEO vẫn cần hiểu rõ hơn về giá trị và rủi ro của công nghệ này đối với doanh nghiệp của họ.
AI tạo sinh khác với các loại trí tuệ nhân tạo khác như thế nào
Như tên gợi ý, cách chính mà AI tạo sinh khác với các dạng AI hoặc phân tích trước đây là nó có thể tạo nội dung mới một cách hiệu quả, thường ở dạng “phi cấu trúc” (ví dụ: văn bản hoặc hình ảnh) không được thể hiện một cách tự nhiên trong các bảng có hàng và cột.
Mô hình cơ bản cho phép AI tổng quát hoạt động được gọi là mô hình nền tảng. Máy biến áp là thành phần chính của các mô hình nền tảng—GPT thực sự là viết tắt của máy biến áp được đào tạo trước tổng quát. Máy biến áp là một loại mạng thần kinh nhân tạo được đào tạo bằng cách sử dụng học sâu, một thuật ngữ ám chỉ nhiều lớp (sâu) trong mạng thần kinh. Học sâu đã hỗ trợ nhiều tiến bộ gần đây trong AI.
Mô hình cơ bản cho phép AI tạo sinh hoạt động được gọi là mô hình nền tảng. Transformer là thành phần chính của mô hình nền tảng - thực tế GPT viết tắt cho generative pre-trained transformer. Transformer là một loại mạng thần kinh nhân tạo được huấn luyện bằng deep learning, một thuật ngữ chỉ đến nhiều lớp (sâu) trong các mạng thần kinh. Deep learning đã đóng góp rất nhiều cho các tiến bộ gần đây trong lĩnh vực AI.
Tuy nhiên, các đặc điểm riêng của mô hình nền tảng đã phân biệt chúng với các thế hệ mô hình deep learning trước đây. Để bắt đầu, chúng có thể được huấn luyện trên các bộ dữ liệu không cấu trúc rất lớn và đa dạng. Ví dụ, một loại mô hình nền tảng được gọi là mô hình ngôn ngữ lớn có thể được huấn luyện trên lượng lớn văn bản có sẵn trên internet và bao phủ nhiều chủ đề khác nhau. Trong khi các mô hình deep learning khác có thể hoạt động trên một lượng lớn dữ liệu không cấu trúc, chúng thường được huấn luyện trên một tập dữ liệu cụ thể hơn. Ví dụ, một mô hình có thể được huấn luyện trên một tập hình ảnh cụ thể để cho phép nó nhận diện các đối tượng cụ thể trong các bức ảnh.
Thực tế, các mô hình deep learning khác thường chỉ có thể thực hiện một nhiệm vụ như vậy. Chúng có thể, ví dụ, phân loại các đối tượng trong một bức ảnh hoặc thực hiện một chức năng khác như làm dự đoán. Ngược lại, một mô hình nền tảng có thể thực hiện cả hai chức năng này và tạo ra nội dung. Các mô hình nền tảng tích lũy các khả năng này bằng cách học các mô hình và mối quan hệ từ các dữ liệu huấn luyện rộng lớn chúng tiếp nhận, cho phép chúng dự đoán từ tiếp theo trong một câu ví dụ. Đó là cách ChatGPT có thể trả lời các câu hỏi về nhiều chủ đề khác nhau và cách DALL·E 2 và Stable Diffusion có thể tạo ra hình ảnh dựa trên mô tả.
Với tính linh hoạt của một mô hình nền tảng, các công ty có thể sử dụng cùng một mô hình để triển khai nhiều trường hợp sử dụng kinh doanh, điều hiếm khi đạt được bằng các mô hình deep learning trước đây. Một mô hình nền tảng đã tích hợp thông tin về sản phẩm của một công ty có thể được sử dụng cả để trả lời câu hỏi của khách hàng và để hỗ trợ kỹ sư trong việc phát triển phiên bản sản phẩm mới hơn. Kết quả là, các công ty có thể triển khai ứng dụng và thực hiện lợi ích của chúng nhanh hơn.
Tuy nhiên, do cách thức hoạt động của các mô hình nền tảng hiện tại, chúng không phù hợp với tất cả các ứng dụng. Ví dụ, các mô hình ngôn ngữ lớn có thể dễ bị "ảo giác" hoặc trả lời câu hỏi bằng các tuyên bố có vẻ đúng nhưng không chính xác. Ngoài ra, nguyên nhân hoặc nguồn gốc của một phản hồi cũng không được cung cấp luôn. Điều này có nghĩa là các công ty nên cẩn trọng khi tích hợp AI sinh mà không có sự giám sát của con người vào các ứng dụng mà các lỗi có thể gây hại hoặc nơi cần giải thích được. Hiện tại, generative AI cũng không phù hợp để phân tích trực tiếp lượng lớn dữ liệu bảng hoặc giải quyết các vấn đề tối ưu số phức tạp. Các nhà nghiên cứu đang nỗ lực để giải quyết những hạn chế này.
Sử dụng AI tạo sinh một cách có trách nhiệm
AI tạo sinh đặt ra nhiều rủi ro. Các CEO sẽ muốn thiết kế các nhóm và quy trình của họ để giảm thiểu những rủi ro đó ngay từ đầu—không chỉ để đáp ứng các yêu cầu pháp lý đang phát triển nhanh chóng mà còn để bảo vệ doanh nghiệp của họ và giành được sự tin tưởng kỹ thuật số của người tiêu dùng.
Công bằng: Các mô hình có thể tạo ra sai lệch thuật toán do dữ liệu đào tạo không hoàn hảo hoặc các quyết định của các kỹ sư phát triển mô hình.
Sở hữu trí tuệ (IP): Dữ liệu đào tạo và đầu ra của mô hình có thể tạo ra rủi ro sở hữu trí tuệ đáng kể, bao gồm vi phạm bản quyền, nhãn hiệu, bằng sáng chế hoặc các tài liệu được bảo vệ hợp pháp. Ngay cả khi sử dụng công cụ AI tổng quát của nhà cung cấp, các tổ chức sẽ cần hiểu dữ liệu nào được đưa vào đào tạo và cách dữ liệu đó được sử dụng trong kết quả đầu ra của công cụ.
Quyền riêng tư: Những lo ngại về quyền riêng tư có thể phát sinh nếu người dùng nhập thông tin mà sau này kết thúc ở đầu ra của mô hình ở dạng giúp nhận dạng cá nhân. AI tạo sinh cũng có thể được sử dụng để tạo và phổ biến nội dung độc hại như thông tin sai lệch, nội dung giả mạo sâu và ngôn từ kích động thù địch.
Bảo mật: Trí tuệ nhân tạo có thể bị kẻ xấu sử dụng để đẩy nhanh mức độ phức tạp và tốc độ của các cuộc tấn công mạng. Nó cũng có thể bị thao túng để cung cấp các đầu ra độc hại. Ví dụ: thông qua một kỹ thuật gọi là tiêm nhanh, bên thứ ba đưa ra hướng dẫn mới cho mô hình để đánh lừa mô hình cung cấp đầu ra ngoài ý muốn của nhà sản xuất mô hình và người dùng cuối.
Khả năng giải thích: Trí tuệ nhân tạo dựa trên các mạng lưới thần kinh với hàng tỷ tham số, thách thức khả năng của chúng tôi trong việc giải thích cách tạo ra bất kỳ câu trả lời cụ thể nào.
Độ tin cậy: Các mô hình có thể đưa ra các câu trả lời khác nhau cho cùng một lời nhắc, cản trở khả năng của người dùng trong việc đánh giá độ chính xác và độ tin cậy của kết quả đầu ra.
Tác động đến tổ chức: AI tạo sinh có thể ảnh hưởng đáng kể đến lực lượng lao động và tác động đến các nhóm cụ thể cũng như cộng đồng địa phương có thể tiêu cực một cách không tương xứng.
Tác động xã hội và môi trường: Việc phát triển và đào tạo các mô hình nền tảng có thể dẫn đến những hậu quả bất lợi về xã hội và môi trường, bao gồm tăng lượng khí thải carbon (ví dụ: đào tạo một mô hình ngôn ngữ lớn có thể thải ra khoảng 315 tấn carbon dioxide).
Hệ sinh thái AI thế hệ mới nổi
Mặc dù các mô hình nền tảng đóng vai trò là "bộ não" của trí tuệ nhân tạo tổng quát, nhưng toàn bộ chuỗi giá trị đang nổi lên để hỗ trợ đào tạo và sử dụng công nghệ này (Hình 2). Các phần cứng chuyên dụng cung cấp sức mạnh tính toán mở rộng cần thiết để đào tạo các mô hình. Nền tảng đám mây cung cấp khả năng khai thác phần cứng này. MLOps và các nhà cung cấp trung tâm mô hình cung cấp các công cụ, công nghệ và thực tiễn mà một tổ chức cần để điều chỉnh mô hình nền tảng và triển khai nó trong các ứng dụng của người dùng cuối. Nhiều công ty đang tham gia thị trường để cung cấp các ứng dụng được xây dựng trên các mô hình nền tảng, cho phép họ thực hiện nhiều nhiệm vụ cụ thể. Ví dụ, giúp khách hàng của công ty giải quyết các vấn đề về dịch vụ.
Các mô hình nền tảng đầu tiên đòi hỏi mức đầu tư cao để phát triển, dựa trên các tài nguyên tính toán đáng kể cần thiết để đào tạo chúng và nỗ lực của con người cần thiết để tinh chỉnh chúng. Do đó, chúng chủ yếu được phát triển bởi một số gã khổng lồ công nghệ, các công ty khởi nghiệp được hỗ trợ bởi khoản đầu tư đáng kể và một số tập thể nghiên cứu nguồn mở (ví dụ: BigScience). Tuy nhiên, vẫn đang có các nghiên cứu để tạo ra mô hình nhỏ hơn và thể mang lại kết quả hiệu quả cho một số tác vụ và đào tạo hiệu quả hơn. Điều này sau cùng có thể mở ra thị trường cho nhiều người tham gia hơn. Một số công ty khởi nghiệp đã thành công trong việc phát triển các mô hình của riêng họ. Ví dụ, Cohere, Anthropic và AI21 Labs đã xây dựng và đào tạo các mô hình ngôn ngữ lớn của riêng họ.
Đưa AI tạo sinh vào hoạt động
CEO cần hiểu rằng việc khám phá Trí tuệ nhân tạo (AI) tạo sinh không chỉ là lựa chọn tùy ý, mà là bắt buộc. AI tạo sinh có thể mang lại giá trị trong nhiều lĩnh vực sử dụng. Yêu cầu về kinh tế và kỹ thuật để bắt đầu không quá phức tạp, nhưng không hành động sớm có thể dẫn đến tụt hậu so với các đối thủ cạnh tranh. Vì vậy, mỗi CEO nên hợp tác với nhóm điều hành để đánh giá vị trí và cách thức triển khai AI. Một số CEO có thể quyết định rằng việc áp dụng Trí tuệ nhân tạo tổng quát sẽ mang lại cơ hội biến đổi công ty của họ, từ việc nghiên cứu và phát triển đến tiếp thị và bán hàng cho khách hàng. Trong khi đó, những người khác có thể chọn bắt đầu nhỏ và mở rộng quy mô sau. Sau khi đưa ra quyết định, các chuyên gia AI có thể tuân theo các lộ trình kỹ thuật để thực hiện chiến lược, tùy thuộc vào trường hợp sử dụng cụ thể.
Phần lớn giá trị của việc sử dụng AI tạo sinh trong một tổ chức (mặc dù không phải tất cả) sẽ đến từ những người lao động sử dụng các tính năng được tích hợp trong phần mềm hiện có. Ví dụ, hệ thống email có thể cung cấp tùy chọn để tự động tạo bản nháp đầu tiên của tin nhắn. Các ứng dụng năng suất có thể tạo ra bản nháp đầu tiên của bản trình bày dựa trên mô tả. Phần mềm tài chính có thể tạo ra một mô tả văn bản về các tính năng đáng chú ý trong báo cáo tài chính. Các hệ thống quản lý quan hệ khách hàng có thể đề xuất các cách tương tác với khách hàng. Những tính năng này có thể tăng năng suất của tất cả các nhân viên tri thức.
Tuy nhiên, AI tạo sinh cũng có thể mang lại nhiều sự thay đổi hơn trong một số trường hợp sử dụng cụ thể. Dưới đây là bốn ví dụ về cách các công ty trong các ngành khác nhau đang sử dụng AI tổng quát để thay đổi cách thức thực hiện công việc trong tổ chức của họ. Các ví dụ bao gồm từ những công việc yêu cầu ít tài nguyên đến những công việc sử dụng nhiều tài nguyên. Để so sánh nhanh các ví dụ và biết thêm chi tiết kỹ thuật, xin vui lòng xem Phụ lục 3.
Thay đổi công việc của kỹ sư phần mềm
Ví dụ đầu tiên là một trường hợp có độ phức tạp tương đối thấp với lợi ích về năng suất ngay lập tức vì nó sử dụng giải pháp AI tổng quát có sẵn và không yêu cầu tùy chỉnh nội bộ.
Phần lớn nhất trong công việc của kỹ sư phần mềm là viết mã. Đó là một quy trình tốn nhiều công sức, đòi hỏi nhiều thử nghiệm và sai sót cũng như nghiên cứu tài liệu riêng tư và công khai. Tại công ty này, sự thiếu hụt kỹ sư phần mềm lành nghề đã dẫn đến một lượng lớn yêu cầu về các tính năng và bản sửa lỗi tồn đọng.
Để cải thiện năng suất của các kỹ sư, công ty đang triển khai một sản phẩm hoàn thành mã dựa trên AI tích hợp với phần mềm mà các kỹ sư sử dụng để viết mã. Điều này cho phép các kỹ sư viết mô tả mã bằng ngôn ngữ tự nhiên, trong khi AI đề xuất một số biến thể của khối mã sẽ đáp ứng mô tả. Các kỹ sư có thể chọn một trong các đề xuất của AI, thực hiện các tinh chỉnh cần thiết và nhấp vào đề xuất đó để chèn mã.
Nghiên cứu đã chỉ ra rằng những công cụ tương tự có thể tăng tốc độ tạo mã của nhà phát triển lên tới 50 phần trăm và giúp gỡ lỗi, từ đó cải thiện chất lượng của sản phẩm được phát triển. Tuy nhiên, ngày nay, AI tạo sinh không thể thay thế các kỹ sư phần mềm lành nghề. Thực tế là, các kỹ sư có nhiều kinh nghiệm hơn dường như thu được lợi ích về năng suất cao nhất từ các công cụ này, trong khi các nhà phát triển thiếu kinh nghiệm nhận thấy kết quả kém ấn tượng hơn—và đôi khi là tiêu cực—. Một rủi ro đã biết là mã do AI tạo ra có thể chứa lỗ hổng hoặc các lỗi khác, vì vậy các kỹ sư phần mềm phải tham gia để đảm bảo chất lượng và tính bảo mật của mã (xem phần cuối cùng trong bài viết này để biết cách giảm thiểu rủi ro).
Chi phí của công cụ mã hóa AI tạo sẵn có sẵn này tương đối thấp và thời gian đưa ra thị trường ngắn vì sản phẩm có sẵn và không yêu cầu phát triển nội bộ đáng kể. Chi phí khác nhau tùy theo nhà cung cấp phần mềm, nhưng đăng ký phí cố định dao động từ $10 đến $30 mỗi người dùng mỗi tháng. Khi chọn một công cụ, điều quan trọng là phải thảo luận về các vấn đề cấp phép và sở hữu trí tuệ với nhà cung cấp để đảm bảo mã được tạo không dẫn đến vi phạm.
Hỗ trợ công cụ mới là một nhóm nhỏ đa chức năng tập trung vào việc lựa chọn nhà cung cấp phần mềm và giám sát hiệu suất, bao gồm kiểm tra các vấn đề về bảo mật và sở hữu trí tuệ. Việc triển khai chỉ yêu cầu thay đổi quy trình làm việc và chính sách. Bởi vì công cụ này hoàn toàn là phần mềm dưới dạng dịch vụ (SaaS) có sẵn, nên chi phí lưu trữ và tính toán bổ sung là tối thiểu hoặc không có.
Giúp các nhà quản lý mối quan hệ theo kịp tốc độ của thông tin và dữ liệu công khai
Các công ty có thể quyết định xây dựng các ứng dụng AI tổng quát của riêng họ, tận dụng các mô hình nền tảng (thông qua API hoặc mô hình mở), thay vì sử dụng một công cụ có sẵn. Điều này đòi hỏi đầu tư nhiều hơn so với ví dụ trước nhưng tạo điều kiện cho một cách tiếp cận tùy chỉnh hơn để đáp ứng bối cảnh và nhu cầu cụ thể của công ty.
Trong ví dụ này, một ngân hàng doanh nghiệp lớn muốn sử dụng AI tổng quát để cải thiện năng suất của các nhà quản lý mối quan hệ (realtionship managers - RM). RM dành thời gian đáng kể để xem xét các tài liệu lớn, chẳng hạn như báo cáo hàng năm và bản ghi các cuộc gọi thu nhập, để được thông báo về tình hình và các ưu tiên của khách hàng. Điều này cho phép RM cung cấp các dịch vụ phù hợp với nhu cầu cụ thể của khách hàng.
Ngân hàng đã quyết định xây dựng một giải pháp truy cập mô hình nền tảng thông qua API. Giải pháp quét tài liệu và có thể nhanh chóng cung cấp câu trả lời tổng hợp cho các câu hỏi do RM đặt ra. Các lớp bổ sung xung quanh mô hình nền tảng được xây dựng để hợp lý hóa trải nghiệm người dùng, tích hợp công cụ với các hệ thống của công ty và áp dụng các biện pháp kiểm soát tuân thủ và rủi ro. Đặc biệt, đầu ra của mô hình phải được xác minh, giống như một tổ chức sẽ kiểm tra đầu ra của một nhà phân tích cấp dưới, bởi vì một số mô hình ngôn ngữ lớn đã được biết là gây ảo giác. Các RM cũng được đào tạo để đặt câu hỏi theo cách sẽ cung cấp câu trả lời chính xác nhất từ giải pháp (được gọi là kỹ thuật nhanh chóng) và các quy trình được đưa ra để hợp lý hóa việc xác thực các nguồn thông tin và đầu ra của công cụ.
Trong trường hợp này, AI tổng quát có thể tăng tốc quá trình phân tích của RM (từ vài ngày lên vài giờ), cải thiện sự hài lòng trong công việc và có khả năng nắm bắt thông tin chuyên sâu mà RM có thể đã bỏ qua.
Chi phí phát triển chủ yếu đến từ việc xây dựng và tích hợp giao diện người dùng, đòi hỏi thời gian của nhà khoa học dữ liệu, kỹ sư máy học hoặc kỹ sư dữ liệu, nhà thiết kế và nhà phát triển giao diện người dùng. Chi phí liên tục bao gồm bảo trì phần mềm và chi phí sử dụng API. Chi phí phụ thuộc vào sự lựa chọn mô hình và phí nhà cung cấp bên thứ ba, quy mô nhóm và thời gian để sản phẩm khả thi tối thiểu.
Giải phóng bộ phận hỗ trợ khách hàng cho các hoạt động có giá trị cao hơn
Mức độ phức tạp tiếp theo là tinh chỉnh một mô hình nền tảng. Trong ví dụ này, một công ty sử dụng mô hình nền tảng được tối ưu hóa cho các cuộc trò chuyện và tinh chỉnh mô hình đó trên các cuộc trò chuyện với khách hàng chất lượng cao cũng như các câu hỏi và câu trả lời theo ngành cụ thể của mình. Công ty hoạt động trong lĩnh vực có thuật ngữ chuyên ngành (ví dụ: luật, y tế, bất động sản và tài chính). Dịch vụ khách hàng nhanh chóng là một sự khác biệt cạnh tranh.
Đại diện hỗ trợ khách hàng của công ty này xử lý hàng trăm yêu cầu gửi đến mỗi ngày. Thời gian phản hồi đôi khi quá cao, khiến người dùng không hài lòng. Công ty đã quyết định giới thiệu một bot dịch vụ khách hàng AI tổng quát để xử lý hầu hết các yêu cầu của khách hàng. Mục tiêu là phản hồi nhanh chóng với giọng điệu phù hợp với thương hiệu công ty và sở thích của khách hàng. Một phần của quá trình tinh chỉnh và thử nghiệm mô hình nền tảng bao gồm đảm bảo rằng các câu trả lời phù hợp với ngôn ngữ dành riêng cho miền, lời hứa thương hiệu và giọng điệu được thiết lập cho công ty; cần phải giám sát liên tục để xác minh hiệu suất của hệ thống trên nhiều khía cạnh, bao gồm cả sự hài lòng của khách hàng.
Công ty đã tạo ra một lộ trình sản phẩm bao gồm nhiều đợt để giảm thiểu các lỗi mô hình tiềm ẩn. Trong đợt đầu tiên, chatbot đã được thử nghiệm nội bộ. Nhân viên có thể đưa ra câu trả lời “đồng ý” hoặc “không thích” đối với các đề xuất của mô hình và mô hình có thể học hỏi từ những thông tin đầu vào này. Bước tiếp theo, mô hình đã “lắng nghe” các cuộc trò chuyện hỗ trợ khách hàng và đưa ra các đề xuất. Khi công nghệ đã được thử nghiệm đầy đủ, làn sóng thứ hai bắt đầu và mô hình được chuyển sang các trường hợp sử dụng hướng tới khách hàng với sự tham gia của con người. Cuối cùng, khi các nhà lãnh đạo hoàn toàn tin tưởng vào công nghệ, nó có thể được tự động hóa phần lớn.
Trong trường hợp này, AI tổng quát đã giải phóng các đại diện dịch vụ để tập trung vào các yêu cầu phức tạp và có giá trị cao hơn của khách hàng, cải thiện hiệu quả và sự hài lòng trong công việc của các đại diện, đồng thời nâng cao tiêu chuẩn dịch vụ và sự hài lòng của khách hàng. Bot có quyền truy cập vào tất cả dữ liệu nội bộ của khách hàng và có thể “nhớ” các cuộc trò chuyện trước đó (bao gồm cả các cuộc gọi điện thoại), thể hiện một bước thay đổi so với các chatbot của khách hàng hiện tại.
Để thu được lợi ích, trường hợp sử dụng này yêu cầu đầu tư vật chất vào phần mềm, cơ sở hạ tầng đám mây và tài năng công nghệ, cũng như mức độ phối hợp nội bộ cao hơn về rủi ro và hoạt động. Nói chung, các mô hình nền tảng tinh chỉnh tốn gấp hai đến ba lần so với việc xây dựng một hoặc nhiều lớp phần mềm trên API. Tài năng và chi phí của bên thứ ba cho điện toán đám mây (nếu tinh chỉnh mô hình tự lưu trữ) hoặc cho API (nếu tinh chỉnh qua API của bên thứ ba) tính vào chi phí tăng thêm. Để triển khai giải pháp, công ty cần trợ giúp từ các chuyên gia DataOps và MLOps cũng như đầu vào từ các chức năng khác như quản lý sản phẩm, thiết kế, pháp lý và chuyên gia dịch vụ khách hàng.
Tăng tốc quá trình khám phá thuốc
Các trường hợp sử dụng AI tổng quát tùy chỉnh và phức tạp nhất xuất hiện khi không có sẵn các mô hình nền tảng phù hợp và công ty cần xây dựng một mô hình từ đầu. Tình huống này có thể phát sinh trong các lĩnh vực chuyên biệt hoặc khi làm việc với các tập dữ liệu duy nhất khác biệt đáng kể so với dữ liệu được sử dụng để đào tạo các mô hình nền tảng hiện có, như ví dụ dược phẩm này chứng minh. Đào tạo một mô hình nền tảng từ đầu đưa ra những thách thức đáng kể về kỹ thuật, kỹ thuật và tài nguyên. Lợi tức đầu tư bổ sung từ việc sử dụng mô hình hiệu suất cao hơn sẽ lớn hơn chi phí vốn nhân lực và tài chính.
Trong ví dụ này, các nhà khoa học nghiên cứu khám phá thuốc tại một công ty dược phẩm phải quyết định thử nghiệm nào sẽ chạy tiếp theo, dựa trên hình ảnh kính hiển vi. Họ có một bộ dữ liệu gồm hàng triệu hình ảnh này, chứa vô số thông tin trực quan về các đặc điểm của tế bào có liên quan đến việc khám phá thuốc nhưng con người khó diễn giải. Các hình ảnh được sử dụng để đánh giá các ứng cử viên trị liệu tiềm năng.
Công ty đã quyết định tạo ra một công cụ giúp các nhà khoa học hiểu được mối quan hệ giữa hóa chất dược phẩm và kết quả kính hiển vi được ghi lại để tăng tốc các nỗ lực R&D. Vì các mô hình đa phương thức như vậy vẫn còn ở giai đoạn sơ khai, nên thay vào đó, công ty đã quyết định đào tạo mô hình của riêng mình. Để xây dựng mô hình, các thành viên trong nhóm đã sử dụng cả hình ảnh trong thế giới thực được sử dụng để huấn luyện các mô hình nền tảng dựa trên hình ảnh và tập dữ liệu hình ảnh kính hiển vi lớn bên trong của họ.
Mô hình được đào tạo đã gia tăng giá trị bằng cách dự đoán ứng cử viên thuốc nào có thể dẫn đến kết quả thuận lợi và bằng cách cải thiện khả năng xác định chính xác các đặc điểm tế bào có liên quan để khám phá thuốc. Điều này có thể dẫn đến các quy trình khám phá thuốc hiệu quả và hiệu quả hơn, không chỉ cải thiện thời gian định giá mà còn giảm số lượng phân tích không chính xác, sai lệch hoặc thất bại.
Nói chung, đào tạo một mô hình từ đầu tốn gấp 10 đến 20 lần so với việc xây dựng phần mềm xung quanh API mô hình. Các nhóm lớn hơn (ví dụ như bao gồm các chuyên gia máy học cấp tiến sĩ) và mức chi tiêu cho bộ nhớ và điện toán cao hơn giải thích cho sự khác biệt về chi phí. Chi phí dự kiến cho việc đào tạo một mô hình nền tảng rất khác nhau dựa trên mức hiệu suất mong muốn của mô hình và độ phức tạp của mô hình. Những yếu tố đó ảnh hưởng đến kích thước yêu cầu của tập dữ liệu, thành phần nhóm và tài nguyên tính toán. Trong trường hợp sử dụng này, nhóm kỹ thuật và chi phí đám mây liên tục chiếm phần lớn chi phí.
Công ty nhận thấy rằng cần phải có các bản cập nhật lớn đối với cơ sở hạ tầng công nghệ và các quy trình của mình, bao gồm quyền truy cập vào nhiều phiên bản GPU để đào tạo mô hình, các công cụ để phân phối quá trình đào tạo trên nhiều hệ thống và MLOps thực hành tốt nhất để hạn chế chi phí và thời lượng dự án. Ngoài ra, cần có công việc xử lý dữ liệu quan trọng để thu thập, tích hợp (đảm bảo các tệp của các bộ dữ liệu khác nhau có cùng định dạng và độ phân giải) và làm sạch (lọc dữ liệu chất lượng thấp, loại bỏ dữ liệu trùng lặp và đảm bảo phân phối phù hợp với dự định sử dụng). Do mô hình nền tảng được đào tạo từ đầu nên cần phải kiểm tra nghiêm ngặt mô hình cuối cùng để đảm bảo rằng đầu ra chính xác và an toàn khi sử dụng.
Vietnam Report (Lược dịch và biên tập theo McKinsey)