圆海博客-探寻心灵的宁静

您现在的位置是:首页 > 博客 > 正文

博客

北京9岁小学生,已经用AI出书了!罗永浩围观:有事找不到我找AI

2024-06-07 08:50:10博客
一个年仅9岁的男孩,利用AI智能体,竟然出版了一本书!他叫许萌萌,是来自北京市第二实验小学的一名三年级学生。萌萌与AI智能体共创的书叫做《AI少年——火星生存大挑战》,……

一个年仅9岁的男孩,利用AI智能体,竟然出版了一本书!

他叫许萌萌,是来自北京市第二实验小学的一名三年级学生。

萌萌与AI智能体共创的书叫做《AI少年——火星生存大挑战》,是一本科普小说,讲述了发生在火星上的“密室逃脱”的故事。

而他所选用的AI,正是来自智谱AI的智谱清言。

至于这本书具体是如何跟AI共创的,萌萌也做了详细地介绍:

这便是智谱AI在今天刚刚举行的Open Day活动中所展示的较为有趣的环节。

对此,智谱AI CEO张鹏在现场总结道:

而纵观整场活动,我们发现作为国内大模型顶流之一的智谱AI,围绕AI智能体、张鹏的观点,又有了新的发布动作:

  • 清言flow(清流):一个“@”动作,就可以联动数个AI智能体协作,其中还有一个“罗永浩”的官方智能体教你卖货(彩蛋见文末)。

  • MaaS开放平台2.0:能力上去了,价格又打下来了。

接下来,我们就来一同看下,最新的智谱清言能帮我们做些什么。

一个“@”联动AI智能体,每天速读100篇论文

首先就是这次活动的主角之一,清流,正如刚才我们所述,它的可以让用户在GLM-4主对话框或任意一个AI智能体内,只需使用“@”功能,就可以召唤不同的专用AI智能体继续执行任务。

这些AI智能体可以自由组合,形成个性化工作流,以此来提高工作效率。

那么对于天下苦久矣的“读AI论文”这件事,智谱清言的AI智能体是否能帮上忙呢?

毕竟谷歌AI负责人Jeff Dean早在数年前就做过统计,单是在ML领域,每天就会产生超过100篇新论文。

平均三分钟速览一篇,一天也得看上个5个小时。

这个“产速”当年就已经超过了摩尔定律,再加上现在爆火的大模型……读不完,根本读不完!

而现在,有了智谱清言的AI智能体,就能开启“用魔法打败魔法”的模式。

例如我们可以@一下一个名叫“arXiv论文速读/精析(计算机)”的AI智能体:

“唰唰唰”,在arXiv上与视频大模型相关的最新五篇论文就整理好了,而且是题目、作者、摘要、日期、链接等一并奉上的那种。

(AI智能体:大郎~该喝药……读论文了

如果想继续深挖某个论文,我们就可以继续用@的方式调用另一个AI智能体来帮忙,例如**“论文解读助手”:

再如下面这个名叫“论文推荐助手”的AI智能体,更是可以检索清华大学AMiner数据库中,近三年超过600万篇的优质论文。

这次我们提一个概括总结性的问题:

这个AI智能体从今年的各大研究中精准提炼出了“多模态”和“Agent”这两个概念,正是今年的大热门。

如此一来,有了AI智能体们的加持,一天速读100篇论文就不再是什么难事了。

除了读论文这件事,智谱AI在现场还展示了其它AI智能体联动的案例,主打的就是实现“跨部门协作”。

例如“喂”给智谱清言一个5分钟的讲义PPT,让它先生成一个讲义大纲:

然后再@一下“复杂流程图”这个AI智能体,就能把讲义大纲一键转成流程图了:

再如搞个活动策划,现在有了清流,相当于给你配备了多个助理。

我们先向“PPT助手”这个AI智能体提出需求:

当然,即便是AI,方案一次性通过的概率也是不大,这时候我们可以继续在上面这个AI智能体对话框中,@一下另一位AI智能体“活动方案策划达人”来交叉验证一下:

可以看到,“活动方案策划达人”在第一版的基础之上又做了进一步的优化工作。

最后,我们就可以要求“PPT助手”基于优化的版本,来生成PPT了:

不过有一说一,我们现在所熟知的多数AI聊天机器人,依旧是以prompt为驱动,也就是用户问一句,AI就会答一句。

而AI智能体的运作方式则是更具自主性,我们只需给出一个任务目标,它就能一步一步去完成工作。

但现实中的问题往往错综复杂,即便AI智能体能够胜任某个单一的工作,但若对于解决“复合型问题”来说依然存在挑战。

这也正是智谱AI的清流功能要啃下的硬骨头。

如Andrej Karpathy就不止一次的在公开演讲中表达过这个观点,并且他还认为:

OpenDay上,智谱清言还介绍了一个新的功能。知识库,还是可以构建“挂载”超大知识库的AI智能体功能——足足可以hold住100000000(1亿)个字的那种。

我们现在就不妨在亲测一下效果。例如我们上传100篇存在本地的文件(一次可上传50个):

从上传到解析完毕,也就是不到1分钟的事。

并且基于此,我们就可以提一些更有针对性、更符合自己需求的问题,例如:

不仅如此,“上传URL”和“上传文件”,还可以一起联动。

在调试到自己满意为止之后,点击页面右上角“发布智能体”,就可以上架到智谱清言的智能体广场了。

而除了应用上的更新之外,智谱AI在这次的Open Day中在模型层上同样也有新动作。

第四代开源模型GLM-4-9B

GLM-4-9B,正是智谱AI此次带来的最新开源大模型,亮点如下:

  • 更强的基础能力

  • 更长的上下文

  • 有更精准的函数调用和All Tools能力

  • 首次拥有多模态能力

有多强?我们不妨先来看下榜单性能。

整体来看,GLM-4-9B的中英文综合性能相比ChatGLM3-6B足足提升了40%!

对比训练量更多的Llama-3-8B模型,可以说是做到了全面超越,中文学科方面更是有着高达50%的提升。

不仅如此,从多语言能力、函数调用、多模态能力的评测上来看,GLM-4-9B也有不小的提升。

尤其是在多模态方面,是已经可以比肩GPT-4V了!

而且在长文本上下文窗口上,GLM-4-9B更是从128K扩展到了1M之多。

什么概念?相当于一口气可以消化2本红楼梦和125篇论文的文字量!

同样的,通过测试表明,GLM-4V-9B在1M大海捞针任务中取得了全绿的佳绩。

接下来,我们看实测效果。

例如“喂”给它一个公式印花的T恤,即便有褶皱这样的“阻力”,GLM-4V-9B也可以精准识别出是麦克斯韦方程组。

再如把《三体》前三部(约90万字)内容丢进去,GLM-4-9B可以轻松基于此给出第四部的合理提纲。

而除了模型本身之外,智谱AI开放平台也有了新的升级——MaaS开放平台步入2.0时代。

在模型方面,智谱AI主打的就是“发布即上线”,包括刚才新发布的GLM-4-9B等,全部都已经集成到了平台当中。

并且GLM-4全系列都是无需代码,三步完成微调的那种(支持LoRA微调和全参微调),操作上也是相当的简单。

但最为吸睛的,还应当是价格上的调整,来感受一下这个feel:

以GLM-4-Air为例,目前只需1%的价格,在性能上就可以比肩GLM-4了!

不得不说,智谱AI又一次把大模型“多快好省”的用起来这件事狠狠地push了一把。

而这也是整场活动看下来后最为直观的感受。

并且据智谱AI CEO张鹏介绍:

One More Thing

其实在这场活动中,除了我们最开始提到的萌萌小朋友用AI进行了创作之外,现场还展示了众多的画作:

这些画作同样是小朋友们用智谱清言APP创作而来,并且他们岁数最小的只有1岁半,最大的也不超过12岁。

这代表了一种大模型应用普惠的趋势,也意味着大模型带来的人类能力增强,年龄下探、能力门槛几乎为0、人机交互也不必再专门学习相应的计算机语言。

学习AI,比之前所有其他科目和技能的学习,都更重要。

最后的最后,就是揭秘罗永浩彩蛋的时候了,AI老罗成为其清言平台的首位数字员工,工号001,并在智谱清言上向公众开放。罗永浩说自己也在玩。

他在录制的视频中也给予了智谱清言高度的肯定:

除此之外,刘慈欣也和智能体来了个梦回联动。

嗯,这次智谱AI的Open Day是有点fancy在身上的。

—完—