Mô hình
Tôi vô tình khởi nghiệp sau khi tạo ra ứng dụng giúp con trai tự kỷ giao tiếp
(giờ Việt Nam)
Lý do đề xuất
Câu chuyện giàu tính nhân văn, minh chứng cho sức mạnh của AI trong việc giải quyết các vấn đề thực tế và tạo ra tác động xã hội sâu sắc, rất thu hút độc giả.
Tóm tắt
Một người cha đã phát triển ứng dụng hỗ trợ giao tiếp cho con trai mắc chứng tự kỷ không lời. Khi chứng kiến hiệu quả cảm động của nó tại phòng trị liệu, anh quyết định biến dự án này thành một doanh nghiệp để giúp đỡ nhiều trẻ em hơn.
Bản dịch AI






Ba tuần trước, tôi vô tình tìm thấy sự phù hợp của sản phẩm với thị trường (product market fit). Tôi diễn đạt như vậy vì nếu nói theo cách chân thành và nghiêm túc hơn, tôi sẽ quá xúc động. Dù sao thì, tôi đã xây dựng một ứng dụng giao tiếp dành cho trẻ không nói được, khiến 100% các bà mẹ có con không nói được phải bật khóc nức nở. Con trai tôi và tôi đã phát hiện ra điều này ngay ngày đầu tiên mang ứng dụng đến buổi trị liệu ngôn ngữ, khi một vài bà mẹ nhìn thấy nó trong phòng chờ. Sau đó, nó khiến chuyên gia trị liệu của con tôi bật khóc suốt năm phút liền, trớ trêu thay, điều đó lại khiến cô ấy không thể nói được. Tất cả những điều này cũng khiến tôi phải nhìn lên trần nhà và nuốt khan vài lần, vì tôi không nghĩ việc con trai thấy tôi xúc động về chứng tự kỷ của thằng bé là điều tốt.
Vấn đề là: Nó thực sự hiệu quả. Hoặc ít nhất, nó hiệu quả với con trai tôi hơn bất cứ thứ gì trước đây. Và khi tất cả các bà mẹ trong phòng chờ thấy nó hiệu quả, tôi nhận ra — và tôi hứa là mình chưa từng nghĩ đến điều đó cho đến tận khoảnh khắc ấy — rằng tôi không thể chỉ nhún vai và nói rằng con mình là đứa trẻ duy nhất có được nó. Tôi đang có quá nhiều việc phải làm, nhưng tôi buộc phải dành thời gian cho việc cụ thể này, ngay cả khi điều đó đồng nghĩa với việc phải ngủ ít đi trong vài tuần.
Tôi cần phải nói lan man một chút ở đây, nhưng tôi hứa sẽ sớm quay lại phần nội dung vui vẻ/cảm động kiểu Hallmark này.
Thứ nhất, rất khó để biết con bạn có vấn đề về ngôn ngữ hay không vì tất cả trẻ em sinh ra đều chưa biết nói. Một đến hai năm sẽ trôi qua mà bạn chẳng hề hay biết. Sau đó, bạn và vợ sẽ nhận thấy con mình đáng lẽ phải biết nói rồi nhưng vẫn chưa, và bác sĩ nhi khoa sẽ bảo rằng không sao cả. Rồi bạn tiếp tục quan sát và bác sĩ bắt đầu xem xét các câu hỏi chẩn đoán với bạn, có lẽ với vẻ mặt hơi nhíu mày. Sau đó, bạn làm một vài bài khảo sát phân tích hành vi, và tự thuyết phục bản thân rằng thực ra mình chỉ đang quá lo lắng thôi và mọi chuyện vẫn ổn vì bạn đã điền sai các câu hỏi. Bạn sẽ tự nhủ rằng đó là những bằng chứng không đáng tin. Rồi bạn tìm hiểu xem dữ liệu này tập trung như thế nào ở các giai đoạn phát triển sớm và bạn cười thầm rằng mọi thứ sẽ hoàn toàn ổn thôi.
Một ngày nọ, bạn sẽ thấy con mình ở cạnh những đứa trẻ cùng trang lứa. Tất cả những đứa trẻ đó đều đang trò chuyện qua lại một cách trôi chảy, và bạn sẽ chấp nhận rằng thực sự có điều gì đó không ổn.
Có cả một "hang thỏ" (vấn đề phức tạp) về việc phải làm gì với tình trạng này. Một đám người tự xưng là phù thủy sẽ xuất hiện để cố bán cho bạn những thứ chắc chắn là không có thật. Họ sẽ nói rằng con bạn thực sự chỉ cần đến gặp bác sĩ chỉnh xương nhi khoa. Và không phải kiểu bác sĩ chỉnh xương dày dạn kinh nghiệm, người chuyên làm việc với những người tiều phu và đã học được cách trở thành một chuyên gia mát-xa giỏi như người tôi đang gặp, mà là một gã tồi tệ nào đó chuyên bẻ cổ trẻ mới biết đi vì hắn nghĩ mình là một nhà chữa lành tâm linh từ cõi khác. Bạn sẽ nói với kẻ đang bảo bạn đi gặp bác sĩ chỉnh xương nhi khoa rằng bạn không quan tâm, nhưng rồi lại thở dài và chấp nhận việc vợ bạn sẽ cho con dùng rất nhiều loại "thực phẩm bổ sung" mà sau đó bạn sẽ kiểm tra xem chúng có độc không, nhưng có lẽ cũng chẳng có tác dụng gì. Một vài loại thực sự có tác dụng, hoặc ít nhất là có vẻ như vậy, nhưng chúng cũng chỉ là những thứ thông thường mà mọi người hay dùng. Như sắt, ferritin, hoặc một loại dưỡng chất thực sự nào đó không có trong chế độ ăn bình thường của trẻ.
Cuối cùng, sau khi gõ cửa đúng nơi cần đến, bạn sẽ tìm đến chuyên gia trị liệu ngôn ngữ. Điều này thực sự hữu ích, nhưng chuyên gia trị liệu cũng chỉ có thể giúp được đến một mức độ nhất định vì phần lớn phụ thuộc vào khả năng tự nhiên của trẻ. Việc này vẫn đáng làm vì chuyên gia trị liệu sẽ biết đủ loại kỹ thuật mà bạn không biết. Nếu con bạn bị điếc, câm, hoặc những vấn đề tương tự, chuyên gia trị liệu sẽ hỗ trợ bạn. Nếu trẻ gặp vấn đề về cơ thể, có đủ loại giải pháp để giúp trẻ giao tiếp. Nếu đó là vấn đề về nhận thức, chà… tôi rất tiếc. Bạn sẽ thực hiện rất nhiều bài tập và hy vọng sẽ thấy một chút tiến bộ, nhưng đó là tất cả những gì có thể giúp bạn.
Một trong những thiết bị hỗ trợ mà họ sẽ đưa cho con bạn nếu trẻ gặp khó khăn trong việc nói được gọi là AAC, viết tắt của Augmentative and Alternative Communication (Giao tiếp Tăng cường và Thay thế). Thực ra, nó chỉ là một chiếc máy tính bảng chứa đầy từ ngữ và biểu tượng. Chỉ vậy thôi. Nó chẳng hơn một thư mục tệp tin là bao. Bạn kết hợp các từ và biểu tượng lại để tạo thành câu. Thiết bị sẽ phát ra những từ đó. Điều này rất tốt nếu một đứa trẻ không thể tạo ra từ ngữ về mặt vật lý, nhưng đây chủ yếu là thiết bị dành cho những người bị suy giảm khả năng vận động nhưng vẫn hiểu ngôn ngữ bình thường. Nó không được xây dựng dành riêng cho trẻ em và chắc chắn không được tối ưu hóa cho những người ngay từ đầu đã gặp khó khăn trong việc hiểu ngôn ngữ. Khi tôi tìm hiểu lịch sử của những thiết bị này, chúng được tạo ra lần đầu cho những người lớn bị liệt cần chọn lựa mọi thứ dựa trên ánh mắt, và nhìn vào bố cục của tất cả chúng, điều đó hoàn toàn hợp lý.
Chúng tôi đã thử dùng AAC khoảng một năm và con trai tôi không hề hứng thú. Thằng bé chỉ chơi với nó vài phút rồi đặt xuống. Chuyển sang món đồ chơi tiếp theo. Thằng bé chỉ có một chiếc ở chỗ trị liệu ngôn ngữ và ở trường. Tôi không ưu tiên mua cho con một chiếc ở nhà vì thằng bé không phản ứng với nó. Cả đội ngũ chuyên gia trị liệu và giáo viên đều đồng ý rằng thằng bé không quan tâm đến công cụ này và không thể ép nó quan tâm. Thay vào đó, chúng tôi thực hiện các bài tập. Ngắt quãng những gì thằng bé đang làm, cố gắng khiến thằng bé nói một từ để điều hướng hành động, v.v. Thằng bé thích đấu vật và khi nói một cách tự phát, thằng bé thường nói những từ như "Nữa" khi tôi ném nó lên ghế sofa. Chúng tôi tương đối may mắn vì thằng bé có thể nói, dù chỉ bằng một phần trăm tần suất so với những đứa trẻ khác. Một số trẻ thậm chí không có lấy một từ nào.
Mọi người không làm việc trực tiếp với con tôi cứ liên tục thúc ép tôi mua AAC, và lúc đó tôi quá bận rộn cũng như quá thất vọng, tôi không muốn làm cho có lệ nên tôi bảo vợ rằng tôi sẽ tự làm cho con một cái. Tôi đã có ý tưởng này từ lâu vì không khó để nhận ra con mình cần gì. Vấn đề với AAC là hệ thống biểu tượng. Những gì nó làm lại chính là điều thằng bé gặp khó khăn. Nếu đây là lần đầu bạn đọc bài của tôi, tôi đoán mình là một kỹ sư AI triển khai thực địa (Forward Deployed AI engineer)? Có những người làm việc cho tôi tự mô tả bản thân là kỹ sư AI, ít nhất là vậy. Tôi không thực sự nghĩ về bản thân theo những thuật ngữ đó, nhưng có lẽ nó đủ gần để bạn hiểu.
Một chiếc AAC truyền thống quá trừu tượng. Con trai tôi không hề hiểu rằng hình bát giác màu đỏ có nghĩa là dừng lại. Thằng bé không biết "dừng lại" nghĩa là gì trong ngữ cảnh đó. Tương tự với các mũi tên hay những hình người que nhỏ xíu khác. Vì vậy, tôi ngồi xuống, "vibe-code" (lập trình nhanh theo cảm hứng) một trang web giá rẻ trong hai giờ với các điều hướng cơ bản và tạo ra vài trăm từ vựng bằng hình ảnh ChatGPT, nơi tất cả các hình ảnh trông giống như thằng bé đang làm những việc khác nhau, hoặc là đồ đạc thực tế của thằng bé. Và tôi làm tất cả những điều này theo phong cách hoạt hình yêu thích từ các chương trình yêu thích của thằng bé. Tôi sao chép giọng nói của chính mình vì tôi là người mà thằng bé lắng nghe thường xuyên nhất, và tôi thiết lập để khi thằng bé nhấn vào các nút, chúng đều phát ra từ hoặc cụm từ đó bằng giọng của tôi. Tôi sắp xếp các từ theo cách mà tôi cho là có ý nghĩa với thằng bé.
Chúng tôi có một chiếc laptop màn hình cảm ứng nên tôi chỉ cần tải trang web lên đó và đưa cho thằng bé.
Thằng bé lập tức bị mê hoặc. Đây không chỉ là một hệ thống biểu tượng đối với thằng bé. Đó là cuộc sống thực của chính nó, giống như một cuốn truyện hay một trong những bộ phim hoạt hình yêu thích, được bày ra trước mắt. Thằng bé nhận ra chính mình trong tất cả các hình ảnh mà không cần cố gắng. Không có hình ảnh một chiếc bánh mì vòng phô mai chung chung, mà là hình ảnh chiếc bánh mì vòng phô mai của chính thằng bé. Không phải hình ảnh đồ chơi chung chung, mà là hình ảnh cụ thể về món đồ chơi của thằng bé. Thằng bé cứ nhấn vào hình ảnh cha tôi hết lần này đến lần khác. Sau đó, thằng bé nói câu dài nhất mà nó từng nói: "Con thực sự yêu ông rất nhiều."
Cha tôi nói câu này với thằng bé suốt.
Có rất nhiều khoảnh khắc tôi phải nhìn lên trần nhà và nuốt khan vì điều đó.
Chúng tôi chụp ảnh tất cả thức ăn của thằng bé và giải thích rằng hình ảnh bàn tay vươn ra có nghĩa là "Con muốn" và chỉ cho thằng bé cách truy cập danh sách thức ăn. Suốt bốn năm, tôi không thể tìm ra thằng bé muốn ăn gì và rồi đột nhiên mọi thứ trở nên đơn giản. "Con muốn cam", "Con muốn bánh quy bơ đậu phộng", "Con muốn bánh mì nướng kiểu Pháp". Món đồ chơi nào khiến thằng bé khó chịu? Nhấp vào hình ảnh và thế là xong. Đây là những chiến thắng tưởng chừng nhỏ bé nhưng lại vô cùng to lớn, khiến tôi thực sự tức giận với bản thân vì đã không làm điều đó sớm hơn. Chúng tôi có thẻ ghi nhớ ép nhựa, thậm chí có cả album ảnh, nhưng trước đây chưa có gì được tạo ra đặc biệt để thu hút sự chú ý của thằng bé. Xét về khía cạnh sản phẩm, tôi đã xây dựng sản phẩm xoay quanh thằng bé. Thằng bé cần có khả năng bảo tôi áp đầu vào đầu nó, vì vậy tôi đã tạo một ô mà thằng bé có thể nhấn vào để nói: "Con cần áp đầu."
Sau đó, tôi trở nên tức giận về toàn bộ tình trạng của lĩnh vực này. Tôi hứa là cũng có rất nhiều niềm vui khi thấy sự tiến bộ, nhưng sau đó là rất nhiều sự phẫn nộ. Có lẽ tất cả đều không đúng chỗ vì những người làm việc với trẻ khuyết tật đều là những người rất tử tế, nhưng tôi thấy mình trở nên cáu kỉnh. Bạn có biết những thứ này thậm chí không đi kèm với các chỉ số đo lường không? À, có một loại thì có, nhưng gần như không có thông tin gì. Bạn thậm chí không thể biết liệu con mình có tiến bộ theo thời gian hay không. Hay tần suất chúng nhấn các nút nào hoặc khi nào. Và khi bạn hỏi liệu có cái nào có chế độ giảng dạy không, thì không. Không một cái nào cả. Một lần nữa, chúng dành cho những người về cơ bản đã biết nói. Và bạn thấy những cuộc tranh cãi về những thứ chẳng giúp ích được gì cho ai, như việc từ vựng không nên bị hạn chế dựa trên khả năng, và rồi bạn trở nên cực kỳ tức giận vì một người mẹ đang kiệt sức khi cố gắng cho con ăn sẽ rất muốn có một thực đơn giải quyết ngay vấn đề đó, đặc biệt nếu đó là giới hạn phát triển ngôn ngữ của đứa trẻ.
Vì vậy, tôi đã tích hợp các chỉ số và chế độ giảng dạy, và trong hai tuần, khả năng nhận biết và tìm ra một ô từ một từ của thằng bé đã tăng hơn gấp đôi. Sau đó, tôi đặt nó vào một lịch trình để thằng bé nghe thấy một bài hát phát lên, rồi chạy lại chơi trò chơi ghép hình hoặc nghe nó phát trình chiếu. Cứ bốn mươi lăm phút, nó lại hỏi thằng bé có cần đi vệ sinh không. Khi chúng tôi lái xe đến các buổi hẹn, tôi nhấn vài nút trên điện thoại di động và máy tính bảng của thằng bé chuyển sang chế độ giảng dạy về những thứ thằng bé sẽ tương tác tại buổi hẹn đó. Nếu tôi muốn hỏi thằng bé điều gì đó mà thằng bé không hiểu, tôi gõ vào ứng dụng trên điện thoại và nó xuất hiện trên màn hình của thằng bé bằng các biểu tượng mà thằng bé quen thuộc như chữ tượng hình. Đột nhiên thằng bé hiểu ra, vì nơi mà thằng bé tập trung sự chú ý giờ đây đã làm nổi bật ý nghĩa đó cho nó.
Sau ba tuần như vậy, thằng bé là một cậu bé không vui vẻ chút nào. Ý tôi là, nó rất cáu. Thằng bé cực kỳ thất vọng vì giờ đây nó đã có tiếng nói và nó không quen với việc có tiếng nói. Sự thấu hiểu đi kèm với những trách nhiệm. Đột nhiên, những cảm xúc đói hay cáu kỉnh của thằng bé không còn đủ nữa, và mẹ nó cùng tôi sẽ không dành thời gian để đoán ý thằng bé nữa mà thay vào đó sẽ chỉ vào máy tính bảng và lặp đi lặp lại: "Nhấn để nói!"
Nhân tiện, thằng bé đang nói. Nhiều hơn trước rất nhiều. Có lẽ gấp năm lần, nên nhiều hơn hẳn so với mức cơ bản. Thằng bé không chỉ nhấn nút chọn bánh quy mặn mà còn thêm vào: "Con thích cái đó" bằng giọng của chính mình. Thằng bé không chỉ nhấn chọn cam mà còn thêm vào rằng quả cam "ngon lắm". Tuần trước tại cửa hàng kim khí, người thu ngân đưa cho thằng bé một viên kẹo và thằng bé nói "cảm ơn rất nhiều" bằng giọng của chính mình.
Công việc của tôi, theo cách tôi nhìn nhận, là không được xúc động về điều này và tiếp tục thúc đẩy theo hướng tốt đẹp. Nếu có bất cứ điều gì tôi có thể làm để giúp đỡ một phụ huynh khác ngoài kia, tôi sẽ làm điều đó. Tôi không thể là phụ huynh duy nhất thực sự được hưởng lợi từ việc có một bài hát và trình chiếu phát cho con mình về lợi ích của việc ăn nhiều loại thực phẩm hơn. Chúng tôi đã làm một vài thứ rất nhanh như thế này cho con trai tôi về việc sẽ thật tuyệt nếu thằng bé không chỉ ăn đi ăn lại những món giống nhau. Vì vậy, trong ứng dụng, thằng bé đột nhiên nghe thấy giọng cha mình giới thiệu một bài hát về việc ăn các loại thực phẩm khác trong khi nhìn những bức ảnh chính mình đang thử các món ăn mới.
Con trai tôi đã ăn một chiếc bánh waffle vào tuần trước. Tôi cảm thấy như Rocky ở cuối bộ phim đầu tiên khi anh ấy nhận ra mình đã đánh bại Apollo Creed nhưng không thể tin được điều đó. Tôi đã thử mọi cách để khiến đứa trẻ này ăn nhiều món hơn, bao gồm cả việc "thiết quân luật", nhưng chưa bao giờ hiệu quả và chỉ giống như việc cố gắng cho mèo uống thuốc.
Bây giờ tôi đang tìm hiểu xem nên xây dựng thêm những gì và làm thế nào để ứng dụng này hoạt động cho các gia đình khác, và tôi đang làm nhanh nhất có thể với quỹ thời gian hạn hẹp của mình. Ví dụ, để làm cho ứng dụng này thực sự hiệu quả với nhiều trẻ em và gia đình, tôi cần tạo ra một hệ thống phân loại các từ và cụm từ phổ biến nhất mà một đứa trẻ tiếp thu theo thời gian. Câu chuyện ở đây khá phức tạp, nhưng về cơ bản, tôi cần một khung sườn mà tôi có thể đưa vào ngữ cảnh để khi ai đó chụp ảnh quanh nhà, tôi có thể sắp xếp chúng vào một vị trí nhất quán để tất cả các tính năng tự động vẫn hoạt động. Trải nghiệm của phụ huynh sẽ là họ cho tôi biết màu sắc yêu thích của con, nhấp vào phong cách hoạt hình mà con họ thích, có lẽ họ đọc một đoạn kịch bản trong 30 giây và tải lên vài bức ảnh, rồi bảng điều khiển sẽ tự hoàn thiện. Hơi đau đầu một chút, nhưng tôi đang tự mình gánh vác sự phức tạp đó để khi một bà mẹ kiệt sức với bốn đứa con đang bám lấy mình tải ứng dụng này xuống, cô ấy có đủ năng lượng tinh thần để thiết lập nó trong vòng chưa đầy mười phút. Tương tự với các công việc thường nhật. Tôi muốn một phụ huynh có thể tải lên vài bức ảnh và sau đó tôi bắt đầu thu thập dữ liệu và điều hướng con tàu từ đó. Điều này đòi hỏi tôi phải tìm ra câu trả lời khả thi cho các câu hỏi như "sự thành thạo một chủ đề trông như thế nào về mặt định lượng?" và "điều đó thay đổi như thế nào giữa các nhóm khả năng khác nhau?". Ví dụ, con trai tôi có khả năng chú ý chung (joint attention) thấp. Nếu tôi có được sự chú ý của thằng bé trong một phiên cụ thể, thằng bé sẽ trả lời đúng tất cả hoặc hầu hết các câu hỏi. Nếu tôi không có được sự chú ý của thằng bé, nó sẽ nhấn nút ngẫu nhiên cho đến khi bài kiểm tra kết thúc. Việc này sẽ mất quá nhiều thời gian để ra mắt, khoảng một tháng, nhưng cuối cùng tôi sẽ tích hợp thứ mà tôi đang xây dựng tại công việc chính của mình — chúng tôi đang ở chặng cuối trước khi sản phẩm đi vào hoạt động, đó là lý do tại sao tôi rất bận — nơi phụ huynh có thể trò chuyện tự nhiên với nó và tôi có thể bắt đầu điều chỉnh giao diện người dùng trong thời gian thực.
Phòng khám trị liệu ngôn ngữ của thằng bé muốn sử dụng nó cho những đứa trẻ khác, trường học của thằng bé cũng vậy. Tôi không hề chào mời, đó là lý do tại sao tôi nói về việc vô tình khởi nghiệp một doanh nghiệp nhỏ. Tôi làm nó dành riêng cho con trai mình và sau đó, rõ ràng là khi nhìn lại, mọi phụ huynh khác có con giống con tôi, hoặc chuyên gia làm việc với trẻ giống con tôi, đều muốn có cùng một thứ. Có rất nhiều giấy tờ cần xử lý, ví dụ như tôi không thể gọi nó là thiết bị y tế hay AAC, và sẽ chỉ có thể đưa nó lên thị trường với mô tả đơn giản về những gì nó làm.
Các thiết bị AAC mà tôi mô tả ở trên có thể rất đắt đỏ — nếu bạn mua phần cứng trực tiếp từ nhà cung cấp, nó có thể lên tới hơn bảy nghìn đô la, nhưng nếu bạn đã có iPad, bạn có thể đăng ký với mức giá hợp lý — nhưng tôi nghĩ mình có thể làm ứng dụng này với giá 9,99 đô la một tháng và vẫn thực hiện tất cả các kết nối API AI cần thiết để làm cho nó mạnh mẽ cho các gia đình khác như đối với gia đình tôi. 19,99 đô la một tháng nếu bạn cần sao chép giọng nói vì chi phí duy trì nó đắt hơn. Mục tiêu của tôi là làm cho nó miễn phí khi các gia đình không còn cần tạo hình ảnh mới nữa, hoặc ít nhất là có một gói cơ bản, vì một khi bạn đã tạo vài nghìn hình ảnh, bạn thực sự không cần làm gì nhiều nữa. Đó là mức giá rẻ nhất mà tôi có thể làm một cách có trách nhiệm vì một khi nó hoạt động, tôi phải duy trì nó cho mọi đứa trẻ sử dụng.
Thêm vài tuần nữa và tôi nghĩ mình sẽ có thể để các gia đình khác dùng thử. Dù sao thì, đây là một cập nhật mà tôi hy vọng là vui vẻ đối với nhiều người trong số các bạn.
Bài viết được AI dịch và tổng hợp tự động từ Hacker News Nổi bật (buzzing.cc bản dịch tiếng Trung). Liên kết bài gốc ở phía trên. AIHOT.vn luôn dẫn nguồn đầy đủ — nếu bạn thấy điểm cần chỉnh sửa, hãy gửi ý kiến tại trang phản hồi.