AI 是构建元宇宙的关键底层技术。维基百科对人工智能的定义:人工智能(Artificial Intelligence,缩写为 AI)亦称智械、机器智能,指由人制造的机器所表现出来的智能。通常人工智能是指通过普通计算机程序来呈现人类智能的技术。AI 的初衷并不是要取代人类,而是大幅增强人的能力和贡献。
1►
AI 的定义
2►
强&弱人工智能
强人工智能:强人工智能观点认为“有可能”制造出“真正”能推理和解决问题的智能机器,并且这样的机器将被认为是具有知觉、有自我意识的。强人工智能可以有两类:人类的人工智能,即机器的思考和推理就像人的思维一样;非人类的人工智能,即机器产生了和人完全不一样的知觉和意识,使用和人完全不一样的推理方式。
3►
AI 的四个主要组成部分
4►
传统软件&AI
5►
AI 的基本应用
看:电脑视觉(Computer Vision)、图像识别(Image Recognition)、人脸识别(Face Recognition)、对象侦测(Object Detection)。
听:语音识别(Sound Recognition)。
说:语音生成(Sound Generation)、文本转换语音(Text-to-Speech)。
读:自然语言处理(Natural Language Processing,NLP)、语音转换文本(Speech-to-Text)。
写:机器翻译(Machine Translation)。
认知能力(Cognition)指的是人类通过学习、判断、分析等等心理活动来了解消息、获取知识的过程与能力,对人类认知的模仿与学习也是目前 AI 第二个焦点领域,包括:
🔹分析识别能力:如医学图像分析、产品推荐、垃圾邮件识别、法律案件分析、犯罪侦测、信用风险分析、消费行为分析等。
🔹预测能力:例如 AI 执行的预防性维修(Predictive Maintenance)、智能天然灾害预测与防治。
🔹判断能力:例如 AI 下围棋、自动驾驶车、健保诈欺判断、癌症判断等。
🔹学习能力:例如机器学习、深度学习、增强式学习等等各种学习方法。
创造力(Creativity)指的是人类产生新思想,新发现,新方法,新理论,新设计,创造新事物的能力,它是结合知识、智力、能力、个性及潜意识等各种因素优化而成,这个领域目前人类仍遥遥领先 AI,但 AI 也试着急起直追,主要领域包括:AI 作曲、AI 作诗、AI 小说、AI 绘画、AI 设计等。
智能(Wisdom)指的是人类深刻了解人、事、物的真相,能探求真实真理、明辨是非,指导人类可以过着有意义生活的一种能力,这个领域牵涉人类自我意识、自我认知与价值观,是目前 AI 尚未触及的一部分,也是人类最难以模仿的一个领域。
6►
AI 对人类的“威胁”
🔹AI 会遵循科技发展的加速度理论;
🔹AI 可能会有自我改造创新的能力;
🔹AI 进步的速度远远超过人类;
🔹人类会有被灭绝的危机存在。
🔹依目前的研究方向,电脑无法突变、苏醒、产生自我意志,AI 也不可能具有创意与智能、同情心与审美等这方面的能力。
7►
AI 自动生成图片
Dali 代表作《记忆的永恒》和机器人总动员海报
DALL·E 是如何实现先理解文字,再创造图片的呢?
要从理解 token 开始,语言学中对 token 的定义是词符,或者标记。对于英语来说,每个字母就是一个 token,每一个单词就是一个 tokens。但在 NLP 中,tokens 并不一定代表完整的单词,如 re、ug 等没有实际意义的字母组合也算一个 tokens。在最早提出 Transformer 架构的论文《Attention is all you need》里,就提到了 BPE(Byte-Pair Encoding)编码方法,简单来说,BPE 就是通过分析训练集中每个单词的组成,创建一个基础词汇表,词汇表里涵盖了一定数量最常用的 tokens。
模型中 tokens 的数量是超参数,也就是训练模型中人为规定的。DALL·E 同时包含着 BPE 编码的文本和图像词汇表,分别涵盖了 16384、8192 个 tokens。当需要生成图片时,它以单一数据流的形式,接收 1280 个文本和图像的 tokens(文本 256 个 tokens,图像 1024 个 tokens),建立回归模型。与大多数 Transformer 模型一样,DALL·E 也采用自注意力机制(Self-Attention),分析文本内部的联系。在 DALL·E 的 64 层自注意层中,每层都有一个注意力 mask,就是为了使图像的每个 tokens 都能匹配文本 tokens。
🔹上下文推理。将文本目标“翻译”成图像这个问题,是没有唯一答案的,且语言中常含有字面所没有的引申义。如“日出时,坐在田野上的水豚”的绘画像这一文本目标,其中并没有提到水豚的阴影,但根据经验我们也能知道,日出时,水豚必然会有由于阳光照射产生阴影。因此,DALL·E 就需要通过 Transformer 中的上下文推理,通过自己的“经验”得到这一结论;
【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。