Google所推出的多模态大模型Gemini, 于AI圈里始终热度颇为高涨。
好多人都在向我询问, 它究竟可不可以经受得住考验, 特别是在被用于进行AI文章创作之际, 成效究竟处于怎样的一种状态。
这几周, 我自己深度使用了一番, 从日常办公, 到内容创作, 全都尝试了个遍, 则发现它有些地方着实强得超乎想象, 然而也存在一些令人头疼的毛病。
Gemini写文章质量怎么样
先说说AI文章生成这部分。
Gemini在领会指令这方面真的是有一套, 特别是当你向它清晰地说明你所需要的是什么样的风格, 是什么样的受众, 要达成什么样的目标时, 它能够给出相较于许多国内模型而言更像是“人话”的结果。
比方说, 我让它去撰写一段带有小红书风格的种草文案, 它清楚要运用短句, 要使用emoji, 要营造出画面感呀, 不会像某些特定的模型那样, 写出“本产品具备优秀的多功能性”这种呆滞古板的句子的标点符号句号。
它还会主动 , 在一些 需要情绪衔接的地方 , 添加口语化表达 , 使得文章读起来 , 十分自然。
不过它也有个问题,就是有时候话太多。
明明规定它要进行300字的总结, 它却偏偏写成600字, 并且尤其喜爱在结尾处来上一段以“总之”开头的升华内容, 而这样的习惯在专业写作当中事实上是挺让人厌烦的。
故而当我运用Gemini去进行AI文章生成之际, 一般而言会额外增添一条指令, 使得它不去创作总结性的结尾部分, 仅仅撰写干货内容。
Gemini能看懂图片和代码吗
这个功能是Gemini最让我惊艳的地方。
传张图片到别的大模型那儿, 它最多也就识别下画面内容, 可Gemini不一样, 它能够直接明白图片当中的文字, 解析出里面的表格, 甚至还能洞察其中的逻辑结构呢。
我曾尝试将一幅思维导图的截图扔给它, 让其帮忙撰写一份会议纪要, 它确实可以把各个分支的逻辑关联理得清晰明白, 接着依照层级输出成为文字。
对于从事AI文章生成工作的人而言, 这实在是友好至极, 只需将经过头脑风暴所形成的图扔过去, 它便会助力你搭建起文章的骨架。
代码识别也是它的强项。
我有一位从事开发工作的朋友让我去尝试, 拿来了一段呈现Python出错截图给我, 它不但能够分辨出何处存在语法上的错误, 并且还可以运用注释的形式在回复当中标记出修改方面的提议。
在技术写作场景当中, 这个能力有着特别突出的实用性, 举例来说, 要是你打算去撰写一篇教程, 其中涵盖代码讲解部分, Gemini能够助力你将代码逻辑与文字说明相互结合起来, 进而输出那种质量相当高的技术文章。
当然Gemini也不是没有短板。
它具备联网搜索功能, 然而有时会出现异常情况, 明明我已经给予了联网的授权许可, 可它依旧是运用训练数据当中的陈旧知识来进行回答。
再者, 是中文语料库的丰富程度, 与国产大模型展开比较, 它对于国内流行的梗、网络上热门的词汇的理解, 仍旧欠缺一些档次, 撰写那种需要具备很强网络感的文章之际, 会呈现出些许“翻译语言的腔调”。
从整体上去看, Gemini是一款极其颇具有值得着手去尝试特性的工具, 特别是特别适宜于那些有着需要运用来处理多种不同模态内容情况的写作场景。
倘若你能够接纳它不时出现的啰嗦情形, 以及小众表达所呈现出的不够自然的状况, 那么它于AI文章生成这一方面所具备的能力, 绝对是能够助力你显著提升效率且十分有效的。
标签: AI写作 文章生成 多模态大模型 代码识别 内容创作
还木有评论哦,快来抢沙发吧~