2010 年,作为媒体实验室的学生,Karthik Dinakar SM '12、PhD '17 和 Birago Jones SM '12 联手开展了一个课堂项目,旨在开发一种工具,帮助 Twitter(现为 X)和 YouTube 等公司的内容审核团队。该项目引起了极大的轰动,研究人员受邀在白宫举行的网络欺凌峰会上进行演示 — 他们必须让这个工具发挥作用。 白宫活动前一天,迪纳卡花了几个小时试图制作一个可以识别 Twitter 上令人担忧的帖子的演示。晚上 11 点左右,他打电话给琼斯说他要放弃了。
然后琼斯决定查看数据。结果发现迪纳卡的模型标记了正确类型的帖子,但发帖者使用了青少年俚语和其他迪纳卡没有注意到的间接语言。问题不在于模型,而在于迪纳卡和他试图帮助的青少年之间的脱节。
“就在我们入主白宫之前,我们意识到建立这些模型的人不应该只是机器学习工程师,”迪纳卡说。“他们应该是最了解数据的人。” Pienso 联合创始人 Birago Jones SM '12 表示:“这类应用对我们很重要,因为我们的根基在于网络欺凌,并了解如何将人工智能用于真正帮助人类的事情。”
Pienso 的诞生:赋能领域专家
这一见解促使研究人员开发出点击式工具,让非专业人士也能构建机器学习模型。这些工具成为了 Pienso 的基础,如今,Pienso 正在帮助人们构建大型语言模型,用于检测虚假信息、人口贩卖、武器销售等,而无需编写任何代码。
琼斯说:“这些应用对我们很重要,因为我们的根基在于网络欺凌,并了解如何使用人工智能来真正帮助人类。”
至于在白宫展示的系统的早期版本,创始人最终与马萨诸塞州剑桥附近学校的学生合作,让他们训练模型。
“那些孩子训练的模型比我能想到的任何模型都要好得多,也更细致入微,”迪纳卡说。“比拉戈和我突然顿悟,意识到赋予领域专家权力——这与人工智能的民主化不同——才是最好的前进道路。”
从麻省理工学院到皮恩索:创新之旅
琼斯和迪纳卡在麻省理工学院媒体实验室的软件代理研究小组读研究生时相识。他们在课程 6.864(自然语言处理)上开始研究 Pienso,直到 2012 年获得硕士学位。
事实证明,2010 年并不是创始人最后一次受邀到白宫展示他们的项目。这项工作引起了极大的热情,但创始人一直在兼职开发 Pienso,直到 2016 年,迪纳卡在麻省理工学院获得博士学位,深度学习开始大受欢迎。
“我们仍然与校园里的许多人保持联系,”迪纳卡说。“我们在麻省理工学院的接触,人机界面的融合,拓宽了我们的理解。如果没有麻省理工学院的活力,我们在 Pienso 的理念就不可能实现。”
创始人还感谢麻省理工学院的工业联络计划 (ILP) 和初创企业加速器 (STEX) 帮助他们与早期合作伙伴建立联系。
SkyUK 是该公司的早期合作伙伴之一。该公司的客户成功团队使用 Pienso 建立模型来了解客户最常见的问题。如今,这些模型每天帮助处理 50 万个客户电话,创始人表示,通过缩短公司呼叫中心的通话时间,他们迄今已为公司节省了 700 多万英镑。
“人工智能的普及和人工智能赋予人类权力之间的区别在于谁最了解数据——是你、医生、记者还是每天与客户打交道的人?”琼斯说。“这些人应该创建模型。这就是你从数据中获取洞察力的方式。”
2020 年,美国爆发新冠肺炎疫情时,政府官员联系了创始人,希望他们能利用他们的工具更好地了解这种新出现的疾病。皮恩索帮助病毒学和传染病专家建立了机器学习模型,挖掘了数千篇有关冠状病毒的研究文章。迪纳卡说,他们后来了解到,这项工作帮助政府确定并加强了药物的关键供应链,包括广受欢迎的抗病毒药物瑞德西韦。
“这些化合物是由一个不懂深度学习但能够使用我们平台的团队发现的,”迪纳卡说。
Pienso:人工智能应用的新范式
由于 Pienso 可以在内部服务器和云基础设施上运行,创始人表示,它为被迫通过使用其他人工智能公司提供的服务捐献数据的企业提供了一种替代方案。
“Pienso 界面是一系列拼接在一起的网络应用程序,”Dinakar 解释道。“你可以把它想象成用于大型语言模型的 Adobe Photoshop,只不过是在网络上。你可以指向和导入数据,而无需编写一行代码。你可以优化数据,为深度学习做准备,分析数据,如果数据没有标记或注释,可以为其提供结构,然后在 25 分钟内就可以得到经过微调的大型语言模型。”
今年早些时候,Pienso 宣布与 GraphCore 建立合作伙伴关系,后者为机器学习提供了更快、更高效的计算平台。创始人表示,此次合作将通过大幅降低延迟来进一步降低利用人工智能的门槛。
“如果你正在构建一个交互式人工智能平台,用户不会在每次点击按钮时都喝一杯咖啡,”迪纳卡说。“它需要快速且反应灵敏。”
创始人相信,他们的解决方案将使未来由最熟悉他们试图解决的问题的人为特定用例开发更有效的人工智能模型。
“没有一个模型可以做所有事情,”迪纳卡说。“每个人的应用程序都不同,他们的需求也不同,他们的数据也不同。一个模型不太可能为你做所有事情。关键是将各种模型整合在一起,让它们相互协作,并以合理的方式协调它们——而进行协调的人应该是最了解数据的人。”