当前位置:贝登书院>其他类型>大白话聊透人工智能> OpenAI:从“会聊天的机器人”到改变世界的公司
阅读设置(推荐配合 快捷键[F11] 进入全屏沉浸式阅读)

设置X

OpenAI:从“会聊天的机器人”到改变世界的公司(2 / 5)

说小明“爱冒险”),不会前后矛盾——就像它“记着你的偏好”。

当然,chatgpt也不是“万能的”:它有时候会“一本正经地说胡话”(比如编造一个不存在的历史事件),也不会“实时更新知识”(比如你问它“2024年最新的电影有哪些”,它可能答不上来,因为它的知识截止到某个时间点),而且它不会“自己思考”——它所有的回答,都是基于之前学过的知识“拼出来的”,不是像人一样“真的理解了”。

除了chatgpt,openai还有个“ai画家”发音像“达利”,跟那个着名画家同名)。它的功能很简单:你用文字描述一个场景,它就能生成对应的图片。

比如你说“一只穿着西装的柯基,坐在咖啡馆里用笔记本电脑工作,背景是复古风格的街道”能给你画出一只萌萌的柯基,穿着合身的小西装,面前放着迷你笔记本,旁边还有一杯咖啡,背景里的街道有旧旧的路灯和店铺——细节拉满,就像真的有人画出来的一样。

3 gpt-4:比chatgpt更“聪明”的“超级大脑”

你可能听过“gpt-4”这个词——它其实是chatgpt的“升级版”,2023年3月推出的。如果说chatgpt是“高中生水平”,那gpt-4就是“大学生水平”在两个地方:

第一,“能看懂图片”。chatgpt只能处理文字,比如你给它发一张照片,它会说“我看不懂图片”;但gpt-4能“看图说话”:你给它发一张“冰箱里的食材照片”,它能告诉你“里面有鸡蛋、西红柿、黄瓜,可以做西红柿炒鸡蛋、拍黄瓜”;你给它发一张“数学题的图片”,它能帮你分析题目,还能写解题步骤——相当于给ai加了“眼睛”。

第二,“处理复杂问题更厉害”。比如你让它“写一份‘小型咖啡店的创业计划书’,要包括成本预算、客源分析、营销方案”,chatgpt可能会写得比较笼统,但gpt-4能给你算具体的数字(比如“房租每月5000元,咖啡豆进货价每斤80元”),还会分“初期、中期、后期”给你提营销建议(比如“初期搞‘买一送一’,中期做会员体系,后期和周边花店合作”);甚至你让它“分析一篇1000字的论文,指出逻辑漏洞”,它能一条一条列出来,还会给你修改建议——就像一个“专业顾问”。

不过gpt-4不是免费的:现在你用的免费版chatgpt,大多是基于“gpt-35”(gpt-4的前一代),要想用gpt-4,得花钱开“ps会员”(每月大概20美金),这也是openai赚钱的主要方式之一。

三、openai是咋“从零到一”搞出chatgpt的?

很多人觉得openai搞出chatgpt是“突然爆发”,其实不是——它花了8年时间,一步一步慢慢磨出来的。咱们用“做饭”来类比,你就能明白它的研发过程有多难。

第一步:“买菜”——收集全世界的“知识食材”

要做一顿大餐,首先得买菜;要训练ai,首先得“喂”它知识。openai训练chatgpt的第一步,就是收集“全世界的文字数据”——相当于把“菜市场里所有的菜都买回家”。

这些数据从哪来?

- 公开的网站:比如维基百科、百度百科、各种新闻网站、博客(只要是没加密、能公开看的文字,都会被收集);

- 书籍和论文:比如图书馆里的经典书籍、学术数据库里的论文(当然,会避开有版权的内容,或者跟版权方合作);

- 对话数据:比如以前人们和其他ai聊天的记录、公开的论坛对话(比如 reddit 上的帖子),用来教ai“怎么聊天”。

收集来的数据有多少?说出来你可能不信:训练gpt-3(chatgpt的前一代)时,用了大概45tb的数据——相当于把10万部电影的文字内容,或者1000亿页小说,全部塞进ai的“大脑”里。

但这些数据不是“直接用”的,还得“洗菜”:比如去掉脏话、错误信息(比如“地球是平的”这种谣言)、重复内容(比如网上反复转载的同一篇文章),不然ai学了坏东西,就会“说胡话”。这一步很枯燥,但很重要——就像你买菜回来,得把烂叶子摘掉、把泥土洗干净,不然做出来的饭会难吃。

第二步:“做饭”——用超级电脑“炒”

食材准备好,接下来就是“做饭”——这一步是openai最核心的技术,也是最烧钱的地方。

这里的“锅”,就是“超级电脑”:openai用的是微软azure的云服务器,里面有上万颗“gpu芯片”(相当于电脑的“大脑”)。这些芯片同时工作,才能处理几十tb的数据——你可以理解成“用1000口锅同时炒菜”,速度快,但电费和硬件费也贵得吓人。

这里的“菜谱”,就是“算法”:简单说,就是告诉ai“怎么从数据里学知识”。比如,ai看到“猫”这个词,算法会让它记住“猫有四条腿、会喵喵叫、喜欢吃鱼”;看到“今天天气很好

上一页 目录 +书签 下一页