找回密码
 立即注册
搜索
查看: 5|回复: 0

AI成身边灵动伙伴,工作生活全搞定!但它偶尔失灵咋整?

[复制链接]

6463

主题

0

回帖

1万

积分

管理员

积分
19461
发表于 2025-5-7 08:05:27 | 显示全部楼层 |阅读模式
这些原生AI应用“承包”智慧日常

作者/ IT时报记者 潘少颖 孙永会

编辑/ 潘少颖 孙妍

编者按

自某个时刻起,人工智能已不再是冷漠的代码与算法,它已成为我们生活中不可或缺的活泼伙伴。在职场中,无论遇到何种难题或是日常琐事,AI都能代为处理;而在日常生活中,无论是制作照片、视频,抑或是创作歌曲、谱写旋律,AI均能轻松应对。

然而,必须承认的是,AI并非总是可靠,它偶尔也会出现故障,或者说,现阶段AI的能力尚未达到能够满足人类所有愿望的水平。

技术的完善并非一朝一夕可以达成,它需要经历时间的沉淀和实践的累积。人工智能同样需要经过反复的细致打磨,以便在未来更好地满足我们的需求。

工作篇

“AI小秘书”驾到 还有难题吗?

腾讯元宝 VS Kimi智能助手

技术是生产力,掌握技术的能力,是高级生产力。

面对文件处理、数据分析和会议安排等任务,随着人工智能的融入,职场协作已不仅限于同事间的互助,更拓展至人与AI的协作。我们逐渐掌握如何向其提出具体需求,解读其分析输出的结果,并充分利用其优势以提高工作效率。AI这位不知疲惫的“工作狂”正在重塑我们的工作日常,同时,AI的应用也在日益智能化,它们与用户在屏幕前进行着持续的互动,满足他们在工作中的各种需求。试问,当打开电脑的那一刻,谁还调不出几个AI“小秘书”呢?

任务一:做表格

一张表格,让AI“颤抖”

进行数据搜集、信息编排、表格样式选定、列宽与行高调整……在职场中,制作表格是一项既基本又繁琐的工作。看似简单的每一张表格,实际上都蕴含着复杂的技巧和深意。

AI能快速做出一份完美的表格吗?

这是一项需要我制作一个涉及达人投放信息的表格的任务,内容可能涵盖时间安排、达人挑选以及相关注意事项等多个方面。由于我在考虑这些因素时还不够周全,因此请求您协助我进行补充。这项任务旨在指导腾讯元宝和kimi智能助手进行操作。

腾讯元宝在首个回答中提供了一份基础表格的范例,其中涵盖了时间安排、达人挑选、合作模式、推广内容和预算分配等多个方面。对于每一项所需填写的信息,都提供了相应的模板示例,例如合作模式可涉及直播销售,推广内容则可以是产品宣传。尽管表格尚不完整,腾讯元宝却依照规定增添了许多提议,诸如针对达人选择的考量因素,建议关注粉丝规模、粉丝互动程度、内容品质等方面;至于效果评估的指标,则建议关注销售额的增长、品牌知名度的提升等。总体而言,一个基本的表格框架已经形成。

kimi智能助手并未直接提供表格,而是提供了十个不同的维度,每个维度下都有具体的细分项目。例如,在“达人选择”这一维度中,用户可以输入达人的过往合作案例、报价以及合作意愿等信息;而在“预算与成本”这一维度中,则可以填写整体预算、达人费用以及制作成本等相关内容。

在维度分类方面,kimi智能助手提供的维度种类更为丰富。然而,作为出题者,我更倾向于得到一份以表格形式呈现的内容。于是,腾讯元宝和kimi智能助手接下来的任务便是将这些维度信息整理成一张表格。

职场人士与AI在使用表格时都面临着挑战。腾讯元宝提供的仅是一个表格的初步模型,其中展现的内容限于时间安排和达人挑选,其他方面的信息并未包含在表格中;至于kimi智能助手,它甚至未能成功绘制出表格,只是通过“︱”符号将各个维度区分开来,整体看起来显得有些杂乱。

尽管这两个AI应用并未提供一份完整的表格,不过它们在扩展回答中均提供了制作表格的相关技巧,例如kimi智能助手向用户演示了如何利用Excel公式来自动完成总预算的计算。

在初次回应用户时,腾讯元宝与kimi智能助手均能基于基本需求提供补充的视角与建议,这些内容对于用户而言具有一定的参考意义。然而,在将不同维度信息整合为表格的过程中,两者均显现出不足之处,这影响了信息的可读性与便捷性,使得用户不得不进行额外的操作来处理这些信息。

任务二:做PPT

搭出框架 助力“加分”

字体、图片、色彩、动画等元素,与制作表格相似,制作PPT同样是众多职场人士不可或缺的技能。一份设计精良的PPT,往往能成为提升个人魅力的“亮点”。精心美化一份PPT需耗费心思,人工智能或许难以完全胜任,然而,它是否能够制作出一个基础的PPT呢?

腾讯的元宝与kimi智能助手共同策划的演示文稿主题聚焦于“可持续城市发展的未来”,其中每一页都将涵盖可持续城市发展的概念阐述、所遭遇的困难以及未来的发展方向。

《IT时报》记者交给腾讯元宝一项制作PPT的任务,腾讯元宝则直接回应称“无法直接制作PPT文件,可以提供PPT的大纲和内容上的建议”。腾讯元宝所提供的PPT大纲初稿上,封面的标题为“可持续城市发展的未来”,并建议添加一张描绘未来城市的科幻插画或是绿色城市的风景照片。然而,封面之外,其余的PPT并未提供图片方面的建议,同时,每页PPT上呈现的文字内容也较为简略。

将PPT的框架内容具体化为实际幻灯片资料,腾讯元宝在这方面进行了不少细化工作。例如,在阐述“可持续城市发展的定义”时,它提出了环境保护、经济增长、社会包容性等三个方面,并对这些方面进行了详细说明。尽管文字部分已经变得更为详尽,但关于图片的建议部分仍未涉及。

与腾讯元宝的初始版本类似,kimi智能助手提供的首版PPT框架亦较为简约,仅呈现了各页的标题与简要内容。待需进一步详化时,kimi智能助手亦对每一页的内容摘要进行了扩充,尽管所增补的信息并不及腾讯元宝提供的丰富。在探讨“可持续城市发展的定义”时,腾讯元宝强调“环境保护”这一概念,其内容涵盖降低工业废气、汽车尾气等污染物排放;合理利用水资源、森林资源等自然资源;以及维护生物多样性,确保城市中动植物的栖息地不受破坏。相较之下,kimi智能助手对“环境保护”的描述则简化为“减少污染、保护自然资源及生物多样性”。Kimi智能助手在配图推荐上十分细致,例如,针对“可持续城市发展的成功案例”,它建议参考哥本哈根的自行车道以及新加坡的城市风貌。

从这两个App的测试效果来看,我们需亲自动手制作PPT,因为AI只能提供内容与插图上的建议,这对用户快速确定PPT的整体布局大有裨益。然而,若想增强PPT的实际应用价值和视觉美感,AI还需提供更多图片和内容上的建议。当然,若能制作出一份即用型PPT,只需稍加美化即可,那就更理想不过了。

任务三:生成纪要

从“原生态”到“思维导图”

与制作PPT或编制表格等技能性工作相较,将速记内容整理成会议记录的过程较为简便,其核心在于能否有效提取会议的核心内容、决策事项以及任务分配等关键信息。不妨观察腾讯元宝与kimi智能助手在总结和提炼方面的表现如何?

腾讯元宝与kimi智能助手获得了一份共计15000字的“原生态”采访速记,内容主要涉及随申办的发展历程。这份速记未经任何编辑整理,其中包含大量口语化表达以及记者与被采访者之间的交流互动。任务要求整理出其中的关键信息,并详细阐述每个关键点的核心内容。

kimi智能助手提炼出五个关键要点,涵盖了上海市民信箱的启动与革新,以及其向随申办的转变,再到随申办的显著特色和创新举措、以及未来的发展规划。这些要点与记者的采访思路相吻合。针对每个要点的核心内容,kimi智能助手均能详细列举,例如在随申办的亮点方面,它概括了包括一码通城、电子亮证、一站式服务等特色功能。

腾讯元宝同样呈现了类似的框架结构,其中值得关注的细节是,在腾讯元宝的页面左侧,可以查看原始文档,而右侧则设有“总结”、“精读”以及“脑图”三个阅读模块。特别是“脑图”这一特色功能,它将之前整理出的逻辑脉络,以一张清晰直观的思维导图形式呈现,相较于文字内容,其展示效果更为一目了然,并且用户还可以便捷地进行下载。

kimi智能助手在生成思维导图方面不及腾讯元宝那样出色,它提供了Code、经典和手绘三种不同的绘制模式。然而,所展示的图片尺寸较小,且下载后的清晰度不高。

综合评价,腾讯元宝与kimi智能助手在从长篇速记中提炼纪要的能力上均表现出色,对关键信息和核心内容把握精准。尤其在纪要呈现方式上,腾讯元宝表现更为突出,其提供的思维导图设计新颖,颇具吸引力。若用户能根据个人需求对思维导图的布局和样式进行个性化调整,则将更加完善。

娱乐篇

谁是“AI全能王”?

可灵AI VS 豆包 VS 智谱清言

2024年标志着我国文生视频模型领域的蓬勃发展,Vidu、可灵AI、清影等平台纷纷上线,为广大用户带来了多样化的选择,满足了各类创作需求。同时,其应用场景也在不断扩展,从影视动画制作到游戏开发等多个领域,都融入了AI技术的基因。

过去的一年里,你尝试了哪些模型?在使用过程中,你又有哪些心得体会?《IT时报》的记者对可灵AI、豆包以及智谱清言这三款模型进行了详尽的测试。接下来,让我们一起探究,这三款模型在视频、图片和音乐这三个方面展现出的创作实力。

任务一:生成图片

各有千秋 有时会“开小差”

启动可灵AI的图片生成功能,若欲制作一张图像,须提供不超过500字的创意构思,并挑选合适的图片尺寸以及生成图片的数量,该数量介于1至9张之间。此外,还需留意,若需下载无水印的图片,需购买会员服务。

设计一家三口的7天营养菜单、为宠物挑选一个有趣的名字、制作抖音视频脚本模板……相比之下,豆包的“AI生图”功能更为丰富,可供选择的选项也更为多样。页面上提供了包括模板、插画、卡通、水墨、写真等在内的30多种风格选择,并且还包含了扩图、去噪、增强清晰度等多种图像美化功能。

《IT时报》的记者在提问时,逐步深入,使用的提示词汇从简单到复杂逐步演变,先是统一要求:“请制作一张以‘吉祥如意’为主题的春节海报,其尺寸比例为9比16。”可灵AI与豆包均各自制作出了一张图画,观察下来,两幅作品各有特色。豆包制作的图画中包含了众多元素,诸如烟花、祥云、灯笼等,显得十分喜庆且充满活力;而可灵AI的作品则以红色作为基调,辅以红灯笼、红色瓷器等,呈现出一幅较为静态的画面。尽管如此,可灵AI在经过多次调整与训练后,才最终呈现出满意的效果。在此之前,其生成的图画中常常出现“福”字,却缺少了“吉祥如意”的寓意。

随后,《IT时报》的记者进一步丰富了关键词汇,包括:描绘油画、标注着“吉祥如意”的左侧文字、中国文化的精髓、舞狮表演、传统服饰的华丽、五彩斑斓的色彩、红色、黄色、蓝色、绿色、白色、喜庆的氛围、狮头的设计、富有表情的神采、灵动的眼神、蓬松的鬃毛、装饰性的元素、表演者的风采、传统服饰的细节、金色的刺绣、鲜艳的红丝带、寺庙的庄严、庭院的宁静、闪烁的红灯笼、庆典的喜悦、五彩的纸屑以及欢乐的气氛。此次的具体要求更加详尽,两幅画作呈现的效果更为相似,其中热闹非凡的舞狮场景成为焦点,辅以各式渲染气氛的彩带等元素。然而,仔细观察之下,豆包的画作显然更胜一筹,提示词中所提到的关键要素几乎全部得到了体现。

在贵州遵义某个偏远的山村,雪花纷飞,整个村庄被白雪覆盖,呈现出一片银白的世界。这里用瓦片铺就的木屋,其表面涂有鲜艳的红漆,显得格外醒目。屋门前,孩子们欢快地玩着雪仗,洋溢着无尽的欢乐。这种提问方式与关键词提问法相比,差异显著。豆包对提示词的把握相当准确,然而在解析西南地区的建筑特色上却显得不够精准,绘制出的图像更像是欧洲的小镇风貌;相比之下,可灵AI生成的建筑显得更加逼真,但在描绘“孩子们在雪地里嬉戏玩耍,非常开心”的场景时,表现力略显不足。

点评中,可灵AI和豆包的图片生成能力各具特色,为用户提供了多样化的图片创作选项。在效果相似的前提下,用户可依据个人偏好进行挑选。不过,两者在处理提示词理解和特定地域实际应用方面尚有改进余地,我们期待各大模型厂商能持续优化对提示词的解析能力,以及针对特定地域实际情况的训练效果。

任务二:生成视频

“细节大师”与“氛围高手”

豆包视觉模型的测试与使用需提前申请。在视频生成这一领域,我们主要对比的是可灵AI与智谱清言旗下的清影AI视频生成功能。这两款模型均支持文本到视频以及图片到视频的转换。

在文生视频的制作中,《IT时报》的记者采用了温馨而和谐的画面风格,采用了拉远式的运镜手法。其灵感来源于以下描述:如同电影中的镜头,夕阳缓缓西沉,一缕温暖的阳光穿透树梢,洒在波光闪烁的湖面上;树叶随着微风轻轻摇曳,光影交织,此时,一群归巢的鸟儿掠过天际;紧接着,镜头迅速转向右侧,捕捉到了湖边那座小巧的木屋。

记者在对比两个短视频时观察到,尽管使用的提示词一致,所呈现的效果却有着显著的差别。由可灵AI制作出的视频虽满足了基本条件,却未能呈现出“鸟儿在天际翱翔”的画面。而且,视频中的氛围更像是清晨的景象,而非傍晚的日落景色。尽管如此,其运镜技巧却十分到位,让人感到观感上的愉悦。记者对清影AI的表现感到相当满意,湖面在暖阳的映照下,树叶在微风中摇曳,鸟儿的鸣叫声此起彼伏,都显得栩栩如生。然而,美中不足的是,画面中似乎少了那座小木屋,略显遗憾。

《IT时报》记者在制作图片转视频的过程中,挑选了相册中的一张描绘乡村邮递员递送包裹的画面,并输入了这样的提示:“一位邮政工作人员在雪地中缓缓前行,行走间不断紧握着包裹”。在清影AI制作出的视频中,画面出现了明显的抖动,给人一种眩晕的感觉。同时,雪花纷飞,邮递员行走时显得格外谨慎,与提示词的描述有较高的相关性,但整体显得不够自然。此外,视频中草丛的动态也显得与实际情况有所出入。可灵AI的成片质量上乘,画面平稳流畅,缺乏剧烈的波动和多余的动效,画面右下方的草丛轻柔摇曳,邮递员的行走步伐与节奏同现实生活高度契合。

在文生视频领域,这两款大型模型均显示出对文本内容的深刻理解,不过它们在细节描绘和氛围构建方面有所不同;至于图生成视频,它们各自都有独到之处。若您更倾向于画面逼真与细节的丰富性,清影AI似乎略占优势;而若您更看重画面的稳定性、自然流畅以及镜头使用的适宜性,那么可灵AI或许能更好地满足您的需求。在未来的发展中,我们期待在大模型生成的视频里,人物的动作能够更加流畅自然,同时对于提示词的把握和理解也将更为精准深刻。

任务三:生成音乐

定制自己的专属旋律

在这三款大型模型中,豆包模型具备生成音乐的功能,而可灵AI擅长制作视频和图片,智谱清言则专注于创作歌词。

在豆包应用内,点击“音乐生成”选项,用户将看到包括民谣、流行、摇滚在内的超过十种音乐风格,同时,还提供了忧郁、鼓舞、放松等多种情绪氛围供选择。

歌词构成了音乐的重要部分,《IT时报》的记者将“归家、团聚、亲情”定位为音乐的核心主题。不久,豆包便创作出了一首包含歌名、旋律及歌词的音乐作品,而且歌名在歌曲完成之后还可以随意进行调整。

那远在他乡漂泊的孩童,心中涌动着对家的思念,忆起那充满亲情的温馨家园,怀着迫切的归乡之心,踏上了回家的征途……优美的旋律与质朴的歌词相得益彰,这个作品正合记者所期待的成效,然而在演唱方面,仍略带一丝机械的痕迹。

若有人询问是否可对经典音乐进行改编,系统将提示“未经版权持有者授权,对经典音乐进行改编并公开传播等行为属于侵权行为”。然而,若改编仅用于个人练习或娱乐,且不涉及商业用途,则可以尝试根据个人创意,对经典音乐的旋律、节奏、编曲等方面进行适当的调整,例如将原本舒缓的古典乐节奏加快,转变为轻快的风格。由此可见,音乐生成的功能还是以模型“原创”为主。

豆包的“音乐生成”功能打造了一个既便捷又充满创意的音乐创作空间,用户能够轻松制作出各式各样的音乐作品,显著降低了音乐创作的难度。尽管在演唱环节略显机械,但整体表现已经相当出色,并且对版权问题也给予了充分的考虑。我们期待豆包的音乐生成功能在演唱方面能更加贴近自然,同时也希望未来能有更多的大模型加入音乐输出的行列。

排版/ 潘璐

图片/ 腾讯元宝 kimi 可灵AI 豆包AI

来源/《IT时报》公众号
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|【远见科技】 ( 京ICP备20013102号-58 )

GMT+8, 2025-5-18 15:14 , Processed in 0.179484 second(s), 20 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表