为什么不是大家想要的
难道未来的人工智能只能停留在画画、写诗这样基于历史知识的静态任务上吗?它能否真正融入我们的日常生活,完成如做饭、洗碗这样需要与环境实时交互的挑战?让我们阅读本文探讨大模型在处理不同类型任务时的表现和局限,以及未来AI在用户交互方面的发展潜力。
你一定见过这句话,“你想要AI扫地,洗碗,做饭,可是它在画画,写诗,唱歌”。这是因为信息技术从诞生到现在都是“程序化”的“存储结构”设计,就是你必须“预先”“存好””程序”才能按“程序”进行。你要快速实时处理,基本没有“现场口占”,只有“数据在传输前的先过滤等基本处理的”边云架构,你要实时处理还需要人进行现场工作对实时采集的数据进行分析。
而我们所说的做饭,洗碗等需要与环境的实时交互,需要实时做出响应,以及对环境及其他干预的应对,这不是可以提前预设的。这是现场性的交互性的任务。而我们说的画画,写诗,唱歌等这些看似是对人的创造性要求更高的活动,都是对过往的数据,历史知识进行总结,学习,在新的应用中并不必须强调交互性,现场性的任务,所以现在大模型在应答,绘画,唱歌等这些依据过往经验的“静态”应用中,效果很好,而对做饭,洗碗等这些活动,进展稍慢。其实华为已经实现了无图自动驾驶,自动驾驶就是与环境交互的一个方面的行业应用,目前已进入可以应对的高级自动驾驶阶段。
这是AI应用的一个分析。
现在大模型并不能被用户进行“交互性,实时性“教授,学习和改进,这也是大模型太大,训练周期长,也不能交互学习,还是像各位家长给孩子讲题一样,怎么讲过还不会,又错了。但是这个靠对过去知识讲解的领域,很适合大模型。这也是画画,写诗,唱歌这些依靠历史知识,静态任务,应用效果好的原因,因此行业上来讲一个AI老师比家长会耐心好多。
也就是说大模型在对静态任务,依靠过去知识的语言处理上效果更契合,比如翻译,问答,编程等。而大家认为要求更高的写诗,画画,这些其实都是一种语言,自然适合大语言模型。
给予这个问题问下大模型,看他们怎么解决:
这两天openAI刚发布了GPT4omini,更小更便宜,为什么不是大家想要的用起来也会更省力更快,便于端侧部署,在模型能力相当强大时候,和用户的交互会是下一个亟需解决的问题。
本文由@苏青言原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议