大模型和人一样需要 提高对 编程语言认知

模型,一样,需要,提高,编程语言,认知 · 浏览次数 : 527

小编点评

**GPT-3.5 的模型回答:** 从国内外大模型对这个简单问题的回答答案来看,国内的这些大模型和 GPT 相比,智商还差得远。 **GPT-4 的模型回答:** 从国内外大模型对这个简单问题的回答答案来看,国内的这些大模型和 GPT 相比,智商还差得远。

正文


今天在ChatGLM2-6B 的仓库里看到了这么一个issue: https://github.com/THUDM/ChatGLM2-6B/issues/122

image

这位兄弟说的挺好,其中有点小错误:三星Tizen架构 其实不是架构,是属于arm架构 ,Tizen是 三星的一个操作系统。由此我想到了ChatGLM2 是国人开源的LLM ,因此我去国内的几个大模型应用上面去问问这个问题:

1、科大讯飞的星火大模型:

image

image

看到星火大模型对c# 的认知也是停留在10几年前 ,这和国人对c# 的理解比较接近。 接下来我们去看下百度的文心一言:

image

文心一言也是一样的,这个认知也是停留在10几年前了, 这么看来大模型的认知 受到他的训练者的影响是很大的。 通过这几个国内的大模型可以知道他们的训练数据很差,带满了偏见,对C# 语言的认知还停留在10几年前,下面我们把这个问题问下ChatGPT吧 :

首先问下 GPT-3.5的模型,回答明显比国内这些大模型公正,认知上比较符合事实:

image

image

我们再来用 GPT-4 问一下,回答是正确的:


image

image

从国内外大模型对这么一个简单问题的回答答案来看,国内的这些大模型和 GPT 相比,智商还差得远。 大模型和人一样对这个世界的认知也是有偏差的,喂给她什么知识,他就记住了什么。 马上就要发布.NET 8 的第一个RC版本了, .NET 8带来一个很大特性是NativeAOT, 以后用C# 写的程序,用NativeAOT编译,可以告诉别人说我这程序是C++ 写的, 可以给用Java 通过JNI 来调用。

这个蓝色星球上的C# 语言的采用还是在稳步上升的,Tiobe 的8月份排行榜里,前五名里面只有c# 是在稳步上升,其他的都在下降:

image

今年以ChatGPT为代表的AIGC,微软抓住了, 微软在采用GPT 改造传统应用的过程中开源了一个LLM 开发SDK semantic kernel(简称sk),他的主要语言就是c# , 现在已经支持Java,Python。 SK 经过微软的实践总结,然后在今年的3月份开源,现在已经有star 12k,经过半年时间的社区开源协作,接口逐渐稳定。随着大量企业的GPT 改造浪潮。c# /.NET 会继续上升。

在国内,虽然没有国外那样的上升势头,在国内的很多领域还是非常坚挺的,也有变好的趋势。现在.NET的开源生态已经成熟,剩下就是大家的工程思维和管理思维需要提升,特别是AI领域的算法门槛已经大大的降低,更多的是靠软件工程来补齐,就拿当前在LLM 应用开发领域的两大开发框架 SK 和 langchain来对比,langchain10 几个漏洞,sk没有漏洞。 langchain 是原来搞机器学习算法的人搞的,很多学校里搞算法的博士生算法是厉害,代码基本上不堪入目,使用Python这种胶水代码基本上很难在大并发的工程实践上有什么比用C# 或者Java 好的。现在基于transformer的GPT 模型的落地已经是工程的事情而不仅仅是算法的事情了。

与大模型和人一样需要 提高对 编程语言认知相似的内容:

大模型和人一样需要 提高对 编程语言认知

今天在ChatGLM2-6B 的仓库里看到了这么一个issue: https://github.com/THUDM/ChatGLM2-6B/issues/122: 这位兄弟说的挺好,其中有点小错误:三星Tizen架构 其实不是架构,是属于arm架构 ,Tizen是 三星的一个操作系统。由此我想到了C

华为云MetaStudio全新升级,盘古数字人大模型助力数字人自由

摘要:基于盘古大模型能力,华为云MetaStudio数字内容生产线全新升级,推出数字人模型生成服务和模型驱动服务。 近日,华为开发者大会2023 ( Cloud ) 在东莞拉开帷幕。基于盘古大模型能力,华为云MetaStudio数字内容生产线全新升级,推出数字人模型生成服务和模型驱动服务,旨在通过数

好饭不怕晚,Google基于人工智能AI大语言对话模型Bard测试和API调用(Python3.10)

谷歌(Google)作为开源过著名深度学习框架Tensorflow的超级大厂,是人工智能领域一股不可忽视的中坚力量,旗下新产品Bard已经公布测试了一段时间,毁誉参半,很多人把Google的Bard和OpenAI的ChatGPT进行对比,Google Bard在ChatGPT面前似乎有些技不如人。

ChatTTS,语气韵律媲美真人的开源TTS模型,文字转语音界的新魁首,对标微软Azure-tts

前两天 2noise 团队开源了ChatTTS项目,并且释出了相关的音色模型权重,效果确实非常惊艳,让人一听难忘,即使摆在微软的商业级项目Azure-tts面前,也是毫不逊色的。 ChatTTS是专门为对话场景设计的文本转语音模型,例如大语言助手对话任务。它支持英文和中文两种语言。最大的模型使...

算法金 | 详解过拟合和欠拟合!性感妩媚 VS 大杀四方

大侠幸会,在下全网同名「算法金」 0 基础转 AI 上岸,多个算法赛 Top 「日更万日,让更多人享受智能乐趣」 今天我们来战 过拟合和欠拟合,特别是令江湖侠客闻风丧胆的 过拟合,简称过儿, Emmm 过儿听起来有点怪怪的 1. 楔子 机器学习模型是一种能够从数据中学习规律并进行预测的算法。我们希望

PMP-干系人管理

转载请注明出处: 1.分析干系人管理的两大工具 1.1.权力-利益方阵 第一象限:严防死守(重点管理) 第二象限:投其所好(令其满意) 第三象限:保存关注(定期监督) 第四象限:确保知会(及时告知),采用主动咨询的方式 1.2.凸显模型 凸显模型:就是综合分析相关方权力、紧迫性和合法性,确定相关方需

Llama2-Chinese项目:1-项目介绍和模型推理

Atom-7B与Llama2间的关系:Atom-7B是基于Llama2进行中文预训练的开源大模型。为什么叫原子呢?因为原子生万物,Llama中文社区希望原子大模型未来可以成为构建AI世界的基础单位。目前社区发布了6个模型,如下所示: FlagAlpha/Atom-7BFlagAlpha/Llama2

AI重塑千行百业,华为云发布盘古大模型3.0和昇腾AI云服务

【中国,东莞,2023年7月7日】华为开发者大会2023(Cloud)7月7日在中国东莞正式揭开帷幕,并同时在全球10余个国家、中国30多个城市设有分会场,邀请全球开发者共聚一堂,就AI浪潮之下的产业新机会和技术新实践开展交流分享。 在7日下午举行的大会主题演讲中,华为常务董事、华为云CEO张平安重

GPT-4多态大模型研究

1.概述 GPT-4是OpenAI最新的系统,能够产生更安全和更有用的回应。它是一个大型的多模态模型(接受图像和文本输入,输出文本),在各种专业和学术的基准测试中展现了人类水平的表现。例如,它在模拟的律师资格考试中得分位于前10%的考生之列;相比之下,GPT-3.5的得分位于后10%。 GPT-4是

LLM 大模型学习必知必会系列(三):LLM和多模态模型高效推理实践

LLM 大模型学习必知必会系列(三):LLM和多模态模型高效推理实践 1.多模态大模型推理 LLM 的推理流程: 多模态的 LLM 的原理: 代码演示:使用 ModelScope NoteBook 完成语言大模型,视觉大模型,音频大模型的推理 环境配置与安装 以下主要演示的模型推理代码可在魔搭社区免