← Quay lại dòng tin

Tin ngành · 36 36Kr

Startup TranscEngram của giáo sư ĐH Hồng Kông huy động hàng trăm triệu NDT để phát triển 'bộ nhớ' cho robot

Được sáng lập bởi chuyên gia AI hàng đầu Ma Yi, TranscEngram tập trung xây dựng hệ thống 'não bộ và tiểu não' giúp robot học hỏi thông qua vòng lặp cảm nhận - dự đoán - tương tác, nhằm tạo ra trí tuệ

Điểm 88Thời gian

Lý do đề xuất

Tin tức quan trọng về nguồn vốn lớn trong lĩnh vực Embodied AI, quy tụ đội ngũ học thuật danh giá và hướng đi khác biệt so với các mô hình ngôn ngữ truyền thống.

Tóm tắt

Được sáng lập bởi chuyên gia AI hàng đầu Ma Yi, TranscEngram tập trung xây dựng hệ thống 'não bộ và tiểu não' giúp robot học hỏi thông qua vòng lặp cảm nhận - dự đoán - tương tác, nhằm tạo ra trí tuệ tự chủ có khả năng giải thích và tự sửa lỗi.

Bản dịch AI

Tác giả | Khâu Hiểu Phân (Qiu Xiaofen)

Biên tập | Viên Tư Lai (Yuan Silai)

Hard氪 (Yingke) được biết, "TranscEngram" (忆生科技) đã hoàn tất vòng gọi vốn thiên thần trị giá hàng trăm triệu nhân dân tệ. Danh sách các nhà đầu tư trong vòng này bao gồm cả vốn công nghiệp và các nền tảng vốn nhà nước, cụ thể là: Sino Biopharmaceutical (thuộc tập đoàn CP), Pudong InnoVentures, Zhangjiang Hi-Tech, Zhangjiang Science & Technology Investment, Honsin Electronics, Yunhui Capital, Volcanics Venture, Golden Helm Capital, v.v.

"TranscEngram" cam kết xuất phát từ các nguyên lý khoa học cơ bản, sử dụng vòng lặp khép kín "Cảm nhận — Dự đoán — Tương tác" để xây dựng hệ thống thống nhất "Não bộ + Tiểu não" cho robot, nhằm khám phá thế hệ trí tuệ tự chủ có thể giải thích được (Autonomous Intelligence) tiếp theo.

Nguồn vốn huy động trong vòng này sẽ chủ yếu được sử dụng cho việc nghiên cứu và phát triển mô hình lớn điều khiển hiện thân (Embodied Control) có thể giải thích được cùng các mô hình thế giới vật lý; xây dựng đường ống dữ liệu tương tác hành động toàn thân đa phương thức và huấn luyện thuật toán; mở rộng đội ngũ nhân tài hàng đầu; cũng như xây dựng các trung tâm R&D và cơ sở công nghiệp hóa tại Tiền Hải (Thâm Quyến) và Trương Giang (Thượng Hải), nhằm đẩy nhanh quá trình thương mại hóa hệ thống não bộ và tiểu não trí tuệ hiện thân có khả năng tự sửa lỗi và không ngừng tiến hóa.

"TranscEngram" được thành lập vào tháng 9 năm 2023 bởi Giáo sư Mã Nghị (Ma Yi) – chuyên gia trí tuệ nhân tạo hàng đầu thế giới, Viện trưởng sáng lập Trường Khoa học Dữ liệu và Tính toán thuộc Đại học Hồng Kông, cùng với Giáo sư Cao Thịnh Hoa (Gao Shenghua) và Giáo sư Dương Ngôn Siêu (Yang Yanchao). Giáo sư Mã Nghị là người đạt giải thưởng "David Marr Prize" – giải thưởng danh giá nhất trong lĩnh vực thị giác máy tính, đồng thời là Fellow của IEEE, ACM và SIAM, với hơn 20 năm tích lũy lý thuyết về cảm nhận thị giác và hệ thống thông minh. Ông cũng duy trì sự hợp tác sâu rộng lâu dài với các học giả hàng đầu thế giới như người đạt giải Shaw Prize – Emmanuel Candes và người đạt giải Turing – Yann LeCun, để cùng khám phá các hình thái trí tuệ nhân tạo thế hệ mới.

Theo quan điểm của Giáo sư Mã Nghị, các mô hình lớn hiện nay về bản chất là những "bách khoa toàn thư" sở hữu lượng kiến thức tĩnh khổng lồ. Chúng được huấn luyện theo vòng lặp mở trong các thế giới đóng, do thiếu cơ chế tự xác thực và tự sửa lỗi trong thế giới vật lý, dẫn đến tình trạng "biết cái đó nhưng không hiểu tại sao", từ đó sinh ra ảo giác. Trí tuệ thực sự không nên dừng lại ở đó.

Ông cho rằng, logic cốt lõi để "TranscEngram" thúc đẩy robot tiến tới kỷ nguyên AI 2.0 nằm ở chỗ: phải học tập trong vòng lặp phản hồi "Cảm nhận — Dự đoán — Tương tác" giống như các sinh vật sống. Lấy con người làm ví dụ, mắt, não và tay từ lâu đã đạt được sự phối hợp thống nhất ở mức độ cao – thị giác thu thập ký ức để phục vụ dự đoán, còn đôi tay hoàn thành nhiệm vụ thông qua tương tác.

(Nguồn ảnh/Doanh nghiệp)

Vì lý do này, TranscEngram đã xây dựng kiến trúc thống nhất "Não bộ + Tiểu não", trao cho robot khả năng vòng lặp khép kín tương tự:

"Ký ức thị giác" của não bộ: Mô phỏng mắt người, thu thập và hiểu các mô hình vật lý của môi trường bên ngoài (quan hệ không gian và hình học), từ đó thực hiện các suy luận phức tạp.

"Ký ức cơ bắp" của tiểu não: Mô phỏng tay người, thông qua điều khiển vận động để thu thập và cải thiện mô hình bản thể, tạo ra các chiến lược điều khiển vận động tần suất cao và ổn định.

(Nguồn ảnh/Doanh nghiệp)

Kiến trúc này phá vỡ hoàn toàn giới hạn "không tự biết" của kiến thức tĩnh trong môi trường động. Đồng sáng lập TranscEngram, ông Dương Ngôn Siêu cho biết, dựa vào cấu trúc mạng hộp trắng (white-box) có thể giải thích được, robot có thể tự động chắt lọc các khái niệm tương tác từ dữ liệu khổng lồ, loại bỏ sự phụ thuộc vào việc dán nhãn thủ công và danh sách nhiệm vụ cố định, từ đó đạt được sự tự tiến hóa và học tập tăng cường.

Về hiệu năng thực tế, kiến trúc này thể hiện ưu thế vượt trội so với các thế hệ trước – so với mô hình VLA truyền thống, kiến trúc tiểu não tạo sinh dựa trên ký ức của TranscEngram cải thiện hiệu suất trung bình trên nhiều tác vụ gấp hơn 3 lần, đồng thời có thể hoàn thành xuất sắc nhiều nhiệm vụ với một mô hình duy nhất, tỷ lệ thành công đạt trên 95%.

Quan trọng hơn, cơ chế ký ức cốt lõi của nó không bị ràng buộc chặt chẽ với bản thể robot, có thể nắm bắt cấu trúc vật lý và ngữ nghĩa đằng sau nhiệm vụ, từ đó thực hiện việc chuyển giao kỹ năng giữa các bản thể khác nhau (như kẹp gắp, bàn tay khéo léo, các loại cánh tay có sải tay khác nhau).

Đây chính là chìa khóa để phá vỡ nút thắt của ngành. Trước đây, robot truyền thống phụ thuộc vào lập trình cố định, một khi kịch bản hoặc công cụ thay đổi, người dùng phải điều chỉnh tham số và huấn luyện lại từ đầu. Còn "TranscEngram" thông qua cơ chế ký ức để lưu trữ cấu trúc không gian và thời gian đằng sau nhiệm vụ, giúp robot hoàn thành vòng lặp "Nhìn — Ghi nhớ — Làm — Học", từ đó thoát khỏi sự phụ thuộc vào dữ liệu dán nhãn khổng lồ và thực sự sở hữu khả năng khái quát hóa để suy một ra mười.

Ông Dương Ngôn Siêu cho biết, khi đối mặt với thiết bị lạ hoặc nhiệm vụ mới, robot có thể lập chỉ mục các kỹ năng liên quan thông qua việc quan sát con người làm mẫu, từ đó tạo ra chiến lược thực thi và hoàn thành nhiệm vụ được trình diễn. Điều này không chỉ giảm đáng kể chi phí triển khai mà còn giúp robot có tiềm năng tiến hóa để đối phó với vô số nhiệm vụ trong thế giới thực.

Ở cấp độ thương mại hóa, "TranscEngram" không giới hạn ở việc bàn giao mô hình mà đã xây dựng bốn ma trận sản phẩm bao phủ toàn bộ chuỗi giá trị:

1. Hệ thống thu thập dữ liệu điều khiển từ xa thông minh EngramTeleOp:

Hợp nhất người và máy: Sử dụng ánh xạ quy luật "tiểu não tạo sinh" tiên tiến, thay thế cho việc hiệu chuẩn điểm-đến-điểm cứng nhắc, độ trễ được kiểm soát dưới 10ms, đạt được khả năng điều khiển mượt mà "như hình với bóng", đảm bảo dữ liệu thu thập sạch và trơn tru.

Đa bản thể và đa địa điểm: Người vận hành chỉ cần 5 phút triển khai là có thể bắt đầu dạy robot, hỗ trợ một người điều khiển nhiều bản thể có cấu trúc khác nhau. Đồng thời hỗ trợ điều khiển từ xa qua mạng công cộng với độ trễ cực thấp trên quãng đường hàng nghìn km (ví dụ: điều khiển thời gian thực từ Thượng Hải cho robot tại Thâm Quyến).

2. Hệ thống thu thập dữ liệu vận động từ góc nhìn người thực thi EngramEgo:

Hệ thống này dựa trên góc nhìn thứ nhất của người thực thi, thông qua các thiết bị đeo nhẹ, chi phí thấp để thu thập hiệu quả dữ liệu tư thế toàn thân chất lượng cao trong các kịch bản thực tế ngoài phòng thí nghiệm, bao gồm các kiến thức ẩn như chuyển trọng tâm, mượn lực từ thân người, mở rộng ra mọi kịch bản trong thế giới vật lý thực.

3. Hệ thống điều khiển ký ức vận động thông minh EngramControl:

Chắt lọc dữ liệu thu thập và trình diễn thành "ký ức quy luật hành động" có thể tái sử dụng, giảm bớt việc lập trình lặp lại, giúp robot sở hữu tiềm năng khái quát hóa không cần mẫu (zero-shot) – "học được ngay sau một lần quan sát".

4. Hệ thống ký ức môi trường và điều hướng EngramNav:

Trao cho robot khả năng ghi nhớ các vật thể, vị trí và bố cục không gian trong môi trường, hỗ trợ vượt chướng ngại vật trong môi trường phi cấu trúc quy mô lớn và di chuyển không gian chính xác.

Hiện tại, TranscEngram đang tập trung thúc đẩy hai lộ trình ứng dụng chính –

Kịch bản dịch vụ khách sạn cao cấp: Đi sâu vào các khâu tiêu chuẩn hóa có tính số hóa cao và thời gian làm việc dài, bao gồm vòng lặp dịch vụ như làm thẻ phòng, giặt ủi, phân phối quần áo, dọn dẹp phòng khách, v.v.

Kịch bản lắp ráp linh hoạt trong sản xuất cao cấp: Đào sâu vào các lĩnh vực như hàng không vũ trụ, giải quyết nỗi đau về việc khó thay đổi dây chuyền sản xuất truyền thống, nâng cao hiệu quả kiểm soát chất lượng và hợp tác.

"TranscEngram" đã bố trí các trung tâm R&D và dữ liệu tại Thượng Hải, Thâm Quyến, Bắc Kinh, Tứ Xuyên, đồng thời hoàn tất hợp tác thích ứng với các doanh nghiệp robot hàng đầu như Agibot, Fourier Intelligence, Galactic General.

Giáo sư Mã Nghị cho biết, trí tuệ hiện thân đang chuyển mình từ "sự ồn ào" sang "sự vững chắc". TranscEngram sẽ lấy sự đổi mới nguyên lý cơ bản và vòng lặp dữ liệu thực tế làm động lực kép, cung cấp nền tảng công nghệ chung vững chắc và đáng tin cậy cho kỷ nguyên trí tuệ tự chủ trong thế giới vật lý.

Dưới đây là trích đoạn phỏng vấn của Hard氪 với các đồng sáng lập TranscEngram là ông Dương Ngôn Siêu và Thạch Chí Nho (Shi Zhiru):

Hard氪: Hệ thống ký ức của các bạn bao gồm những phần nào?

Dương Ngôn Siêu: Hệ thống ký ức mà chúng tôi định nghĩa bao gồm hai phần: ký ức thị giác và ký ức cơ bắp. Ký ức thị giác là ký ức về không gian, mô tả cấu trúc hình học và vật thể trong môi trường; ký ức cơ bắp là ký ức về thời gian, mô tả quỹ đạo và cấu trúc trình tự trong quá trình tương tác.

Hard氪: Bộ hệ thống ký ức này đã được kiểm chứng trong kịch bản thực tế chưa? Hiệu quả thế nào?

Dương Ngôn Siêu: Chúng tôi đã tiến hành kiểm chứng trong các kịch bản thực tế, việc mở rộng quy mô và thương mại hóa mô hình cũng là những việc chúng tôi đang thúc đẩy. Xét về hiệu quả, kiến trúc tiểu não tạo sinh dựa trên ký ức có ưu thế rõ rệt so với kiến trúc VLA hiện tại. Về hiệu suất trung bình trên nhiều tác vụ, nó cải thiện hơn 3 lần so với các mô hình VLA hiện có; ví dụ, khi một mô hình xử lý đồng thời các nhiệm vụ như pha cà phê, gấp quần áo, pha trà, nó có thể thực hiện mà không cần thay đổi mô hình và đạt tỷ lệ thành công trên 95%.

Ý chính từ bài gốc

  • 忆生科技 huy động hàng trăm triệu nhân dân tệ vòng thiên thần để phát triển hệ thống bộ nhớ cho robot.
  • Công ty xây dựng kiến trúc 'Đại não' (thị giác) và 'Tiểu não' (vận động) giúp robot học tập qua tương tác thực tế.
  • Kiến trúc dựa trên bộ nhớ giúp robot đạt hiệu suất đa nhiệm cao gấp 3 lần so với mô hình VLA truyền thống.
  • Sản phẩm tập trung vào các ngành dịch vụ khách sạn và sản xuất công nghiệp đòi hỏi tính linh hoạt cao.
  • Công nghệ cho phép robot chuyển đổi kỹ năng giữa các loại phần cứng khác nhau mà không cần lập trình lại.

Bài viết được AI dịch và tổng hợp tự động từ 36kr.com. Liên kết bài gốc ở phía trên. AIHOT.vn luôn dẫn nguồn đầy đủ — nếu bạn thấy điểm cần chỉnh sửa, hãy gửi ý kiến tại trang phản hồi.