2023年8月31日,国内首批通过《生成式人工智能服务管理暂行办法》备案的AI大模型共11家,其中包括北京5家,上海3家,广东2家,安徽1家。北京的有百度的文心一言、抖音的云雀大模型、百川智能的百川大模型、智谱AI的智谱清言大模型、中科院的紫东太初大模型;上海的有商汤科技的商汤日日新大模型、MiniMax的ABAB大模型和上海人工智能实验室的书生通用大模型;广东的有华为的盘古大模型和腾讯的混元大模型;还有安徽的科大讯飞星火认知大模型。
这些国产大模型产品涵盖了文本问答、文学创作、多轮对话、知识问答、文本创作等多个领域,能够理解和生成自然语言文本,拥有强大的语言处理能力,可以为各个行业或领域提供智能化解决方案。
从对多个国产大模型的使用测评来看,在辅助写作方面,目前国内表现较好、能力与ChatGPT较接近的是百度的文心一言,可以列入第一梯队的还有科大讯飞的星火认知大模型、阿里巴巴的通义千问、360智脑和基于抖音云雀大模型的聊天机器人豆包。
当前主流AIGC工具大盘点
目前,国外主流的AIGC工具包括ChatGPT、Claude、New Bing等。
1.大名鼎鼎的ChatGPT
ChatGPT是基于人工智能技术开发的生成式AIGC工具,主要用于协助人类完成一系列任务。
ChatGPT是由OpenAI公司于2022年11月30日发布的聊天型机器人,它可以通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列任务。例如,它可以撰写邮件、论文、脚本,制定商业提案,创作诗歌、故事,生成代码,检查程序错误等。
GPT-4于2023年3月15日发布,是在ChatGPT基础上进一步进化的人工智能工具,它提高了回答准确性,可以识别图片,可以输入更多的文本信息。GPT-4的核心技术基于Transformer的可训练的神经网络,这使它可以在与人类的回答中自动学习,更具有智能特色。GPT-4目前拥有多模式输入和输出功能及硬核应试能力。
2.可以与ChatGPT相媲美的Claude
Claude是一款由Anthropic公司开发的AI聊天机器人工具。Anthropic是一家由前OpenAI团队成员创立的人工智能初创公司。据测试,Claude的水平能力接近GPT-4,在代码、数学、推理方面有重大提升,支持高达100K token的上下文。
此外,Claude也开始面向更广泛的用户群体免费开放,并支持中文使用,其亮点功能包括可一次性上传5个PDF、txt、csv文档(最大10MB)并总结核心内容。
3.微软与OpenAI合作推出的New Bing
2023年5月,微软宣布开放New Bing聊天机器人功能。New Bing是微软和OpenAI的合作成果,提供了AI生成图片等新功能,甚至支持插件。New Bing的核心优势主要体现在以下几个方面。
(1)理解用户的意图和需求。New Bing能够理解用户的意图和需求,并尝试基于这些需求提供准确和完整的答案,而不仅是提供海量的信息供用户自己筛选。
(2)自然语言交互。通过聊天模式,New Bing可以与用户进行自然语言交互,回答用户的各种问题,甚至根据用户的需求生成各种内容,如诗歌、代码、歌词等。
(3)适应不同的语言和风格。New Bing还可以根据用户的语言偏好和风格进行适应性调整,提供更个性化和人性化的搜索体验。
(4)强大的内容生成能力。New Bing能够利用GPT技术的强大生成能力,为用户提供更多有价值和有趣的内容。例如,如果用户想了解某个话题或事件,New Bing可以为其生成一个简洁明了的摘要。
4.人人都能用的国内10大AIGC工具
国内目前可用且已经比较好用的AIGC工具主要有文心一言、讯飞星火认知大模型、360智脑、通义千问、智谱清言、MM智能助理、百川大模型、天工大模型、面壁露卡、悟道2.0等大模型,另外还有能够生成古典格律诗词的九歌人工智能诗词写作系统,能够生成图片、语音和数字人的腾讯智影,以及能够生成图片的触站等。
下面简单介绍这10个相对成熟、在工作中应用较多的AIGC工具,简介内容由各模型自己生成,略有删节或未作改动。
(1)文心一言。
文心一言是一种基于深度学习技术的自然语言处理模型,能够理解和生成自然语言文本,并尝试回答各种问题和提供相关信息。它被广泛应用于智能客服、智能问答、机器翻译、文本生成、文章推荐等领域,能够帮助人们解决问题和创造新的知识。文心一言的技术架构包括多个组成部分,如基于深度学习的自然语言处理模型、基于规则的专家系统和基于机器学习的推荐系统等。尽管存在一些局限性和挑战,如误判和错误、开发和维护成本高以及需要遵守法律和道德规范,但文心一言仍然是一个重要的工具,为人们提供了方便快捷的信息获取和问题解决方式。
2)讯飞星火认知大模型。
讯飞星火认知大模型是科大讯飞研发的以中文为核心的新一代认知智能大模型,能够在与人自然地对话和互动的过程中,同时具备以下多种能力。
内容生成能力:我可以进行多风格多任务长文本生成,如邮件、文案、公文、作文、对话等。
语言理解能力:我可以进行多层次跨语种语言理解,实现语法检查、要素抽取、语篇归整、文本摘要、情感分析、多语言翻译等。
知识问答能力:我可以回答各种各样的问题,包括生活知识、工作技能、医学知识等。
推理能力:我拥有基于思维链的推理能力,能够进行科学推理、常识推理等。
多题型步骤级数学能力:我具备数学思维,能理解数学问题,覆盖多种题型,并能给出解题步骤。
代码理解与生成能力:我可以进行代码理解、代码修改及代码生成等工作。
3)360智脑。
360智脑是由中国360公司研发的大语言模型,是decoder-only结构的模型,借鉴了ChatGPT模型的实现思路。智脑可以完成文本生成、对话、代码生成、画画等任务,比ChatGPT模型拥有更少的参数但更佳的中文性能。智脑的训练语料包含中文和英文、法语等多个语种,最新训练数据截止到2022年12月,因此知识也截止到这个时间。智脑在多个领域都有应用,如智能客服、智能问答、智能写作等。它可以根据当前日期和时间进行推理回复,为用户提供更加智能化的服务。
4)通义千问。
通义千问是阿里巴巴达摩院自主研发的超大规模语言模型,能够回答问题、创作文字,还能表达观点、撰写代码。它是达摩院“通义”大模型系列的最新成果,也是达摩院推动“通义”大模型系列产业化的重要一步。通义千问具有强大的语言生成和理解能力,可以应用于多个领域,如智能客服、文档写作、代码开发等。此外,通义千问还具有跨语言的能力,可以支持多种语言的交互和生成。
5)智谱清言。
智谱清言是一款由智谱AI开发的生成式AI助手,适用于Android设备,现已在各大应用商店上线。该助手具有通用问答、多轮对话、创意写作、代码生成及虚拟对话等丰富能力,旨在为用户提供更智能、更便捷、更高效的个性化内容获取服务。
智谱清言基于智谱AI的技术实力,不断完善产品与服务,为广大用户带来更丰富的人工智能产品体验。用户可以通过苹果商店等渠道下载安装,安装应用信息大小约为10MB。截至2023年8月16日,智谱清言的版本为1.2.0(build37),历史版本包括1.2.0(build36)和1.2.0(build35)。
未来,智谱清言还将开放多模态等生成能力,以满足用户在各个领域的需求。
(6)MM智能助理。
MiniMax是一家以大模型研究为核心,专注于人工智能技术研发的科技公司。公司成立于2021年,拥有顶尖的技术团队和雄厚的研发实力,目前已推出MM智能助理、MM语言模型等多个重量级产品。MiniMax致力于推动大模型的产业化发展,为各行各业提供先进的人工智能解决方案。
(7)百川大模型。
百川大模型是由百川智能于2023年7月发布的中国自研大型预训练模型,旨在打造中国版的OpenAI基础大模型及颠覆性上层应用,推动中国开源大模型正式进入商用新纪元。
百川大模型已在多个领域取得显著成果,如自然语言处理、计算机视觉、语音识别等。同时,百川智能也在不断探索大模型在更多领域的应用,如医疗健康、金融科技、教育培训等,以期为社会发展贡献力量。
(8)天工大模型。
天工大模型是一个基于深度学习的大型语言模型,由中国科学院自动化研究所和华为公司合作研发。它是目前世界上最大的中文预训练语言模型之一,包含了超过1.7万亿个参数,是GPT-3的近10倍。
天工大模型采用了Transformer架构,并使用了自监督学习的方法进行预训练。在预训练阶段,天工大模型使用了海量的中文文本数据,包括新闻、百科、小说等,对中文自然语言的理解能力进行了全面的训练。在预训练完成后,天工大模型可以用于各种自然语言处理任务,如文本分类、命名实体识别、情感分析、机器翻译等。
天工大模型的发布,为中文自然语言处理领域的研究和应用提供了强大的工具和资源,有望在中文语言理解和生成方面取得更加出色的成果。
(9)面壁露卡。
露卡是由面壁智能和知乎联合研发的语言模型。面壁智能的愿景是“智周万物”,致力于创造安全、普惠的通用智能,让人们的生活变得更好。知乎是中文互联网高质量的问答社区和创作者聚集的原创内容平台,使命是让人们更好地分享知识、经验和见解,找到自己的解答。
(10)悟道2.0。
悟道2.0是由北京智源人工智能研究院牵头,智谱AI等多家机构共同研发的超大规模智能模型,于2021年6月1日发布。该模型参数规模达到1.75万亿个,可以同时处理中英文和图片数据。悟道2.0的发布标志着中国在大型人工智能模型领域取得了重要突破,对推动人工智能技术的发展和应用具有重要意义。
使用测评中发现,目前国内AIGC大模型中可以下载到手机端来辅助写作的有文心一言、讯飞星火、智谱清言、天工AI搜索、360智脑、豆包等,各种大模型在中文文本生成能力方面逐渐显现出同质化竞争的趋势。当然,基于不同的数据库,不同模型在不同类型的文本生成水平上会存在一定差异。