这篇文章是数学家与计算机科学家合作写的,将范畴论应用于人工智能的强化学习。本文表示,强化学习算法与强化学习算法的复合,还是一个强化学习算法,因而所有强化学习算法构成一个范畴$\textrm{Learn}$。然后在$\textrm{Learn}$里考虑神经网络,并证明在一般情况下,梯度下降也是复合的。如果对纯数学理论,在计算机或者AI有什么应用感兴趣的人,可以看看。我当时下这篇文章,也是好奇代数领域在AI方面有啥应用,其实当时已经知道有个叫热带几何(Tropical Geometry)的领域,就是代数几何在计算机的应用。因为当时AI就很火,但AI可解释性需要很多数学来解决,他们解决不了,所以我留着这篇文章也是打算之后写篇类似的AI应用的文章。
这段时间是AI大火的时期,企业之间大模型的竞争已经进入白热化阶段,很多初创公司也相继涌入了AI大模型赛道。不少人争相加入AI赛道的原因,是相信,这将会是一场新的工业革命,或者说这相当于上次的互联网革命。这里我并不否认这种观点,而是想指出,现在没人真的能确定这场AI大热是否真的能产生堪比工业革命的收益。如果商业化落地成功,且能满足大量的市场需求从而能产生大量的利润,才能说这或许是一场工业革命。而且换位思考一下,如果你确定这是次巨大的机缘,那为什么要公之于众呢?不仅公之于众还要大肆宣扬,生怕有人不知道,这正常吗?是不是跟股市一样,大喊着“牛市”了,要涨了,然后一堆韭菜入局。目前来看,AI的局势还处在混沌摸索之中,绝大多数人的钱注定会打水漂,已经有大量的AI公司倒下了。讽刺的是,有些通过AI热赚到钱的,反而是卖课割韭菜的。然后关于目前的行情,从明星AI创业公司的动向,也能看出一二,不少明星创业公司选择卖身,或者创始团队分崩离析,还有创始人流下烂摊子直接跑路的。就连最大的OpenAI如今创始人团队都走光了。连明星创业公司都如此,如果你这时候选择All in AI,你想想那失败的风险有多大,就跟 ...
我认为不是,真正的护城河应该是用户生态。技术这东西并不需要先天就很强,一个产品哪怕前期技术很烂,只要能积累用户,并把生态做起来,就能逐步取得成功。而技术这东西完全可以通过后天弥补。从这个角度来看当今的AI应用,几乎绝大多数AI应用都没有护城河,哪怕是toC应用也是很容易被取代。目前AI巨头谷歌,其护城河也不是靠AI技术,这也很容易看出来,除了谷歌外还有很多搜索引擎,但他们几乎都无法动摇谷歌的市场份额。至于OpenAI就不提了,把它看成微软的子公司就行了,微软技术不如谷歌,因此希望通过OpenAI来赶超谷歌。因此如果是技术型创业,即产品的核心竞争力是技术的公司,就非常容易被其他竞争对手所淘汰。只要别人技术上突破了,功能上比你的更好,马上用户们就都会去用它的产品。哪怕还有一小部分用户留在你这,你成本也吃不消啊。现在看到ai热潮,脑子一热就打算All in AI的,基本上就是小白鼠。不说太遥远的明星AI初创公司,就说小一些的初创公司,哪怕你能拿到1000万融资,哪怕你用户数30w,那又如何,最后还是解散了。而且想想即便是资本发达的美国,也有很多明星初创公司干不下去了,选择卖身(别人卖身 ...
【新智元导读】人工智能模型一直以「黑匣子」的形态让人们感到不安,AI到底从数据中学到了什么?又是如何作出推理?最新研究为你揭秘AI的内部原理人工智能(AI)一直在迅速发展,但对人类来说,强大的模型却是个「黑匣子」。我们不了解模型内部的运作原理,不清楚它得出结论的过程。然而最近,波恩大学(University of Bonn)的化学信息学专家Jürgen Bajorath教授和他的团队取得了重大突破。他们设计了一种技术,揭示了药物研究中使用的某些人工智能系统的运行机制。他们的研究结果表明,这些人工智能模型主要依赖于回忆现有数据,而不是学习特定的化学相互作用,来预测药物的有效性。——也就是说,AI预测纯靠拼凑记忆,机器学习实际上并没有学习!他们的研究结果最近发表在《自然机器智能》(Nature Machine Intelligence)杂志上。论文地址:https://www.nature.com/articles/s42256-023-00756-9在医药领域,研究人员正在狂热地寻找有效的活性物质来对抗疾病——哪种药物分子最有效?通常,这些有效的分子(化合物)会对接在蛋白质上,蛋白质作为 ...
针对大型语言模型效果不好的问题,之前人们主要关注大模型再训练、大模型微调、大模型的Prompt增强,但对于专有、快速更新的数据却并没有较好的解决方法,为此检索增强生成(RAG)的出现,弥合了LLM常识和专有数据之间的差距。今天给大家分享的这篇文章,将介绍RAG的概念理论,并带大家利用LangChain进行编排,OpenAI语言模型、Weaviate 矢量数据库(也可以自己搭建Milvus向量数据库)来实现简单的 RAG 管道。什么是RAG?RAG的全称是Retrieval-Augmented Generation,中文翻译为检索增强生成。它是一个为大模型提供外部知识源的概念,这使它们能够生成准确且符合上下文的答案,同时能够减少模型幻觉。知识更新问题最先进的LLM会接受大量的训练数据,将广泛的常识知识存储在神经网络的权重中。然而,当我们在提示大模型生成训练数据之外的知识时,例如最新知识、特定领域知识等,LLM的输出可能会导致事实不准确,这就是我们常说的模型幻觉。如下图所示:因此,弥合大模型的常识与其它背景知识之间的差距非常重要,以帮助LLM生成更准确和更符合背景的结果,同时减少幻觉。解决 ...
一、引言上一篇对ChatTTS文本转语音模型原理和实战进行了讲解,第6次拿到了热榜第一🏆。今天,分享其对称功能(语音转文本)模型:Whisper。Whisper由OpenAI研发并开源,参数量最小39M,最大1550M,支持包含中文在内的多种语言。由于其低资源成本、优质的生存效果,被广泛应用于音乐识别、私信聊天、同声传译、人机交互等各种语音转文本场景,且商业化后价格不菲。今天免费分享给大家,不要再去花钱买语音识别服务啦!二、Whisper 模型原理2.1 模型架构Whisper是一个典型的transformer Encoder-Decoder结构,针对语音和文本分别进行多任务(Multitask)处理。2.2 语音处理Whisper语音处理:基于680000小时音频数据进行训练,包含英文、其他语言转英文、非英文等多种语言。将音频数据转换成梅尔频谱图,再经过两个卷积层后送入 Transformer 模型。2.3 文本处理Whisper文本处理:文本token包含3类:special tokens(标记tokens)、text tokens(文本tokens)、timesta ...
一、引言我很愿意推荐一些小而美、高实用模型,比如之前写的YOLOv10霸榜百度词条,很多人搜索,仅需100M就可以完成毫秒级图像识别与目标检测,相关的专栏也是CSDN付费专栏中排行最靠前的。今天介绍有一个小而美、高实用性的模型:ChatTTS。二、TTS(text-to-speech)模型原理2.1 VITS 模型架构由于ChatTTS还没有公布论文,我们也不好对ChatTTS的底层原理进行武断。这里对另一个TTS里程碑模型VITS原理进行简要介绍,让大家对TTS模型原理有多认知。VITS详细论文见链接VITS论文对训练和推理两个环节分别进行讲述:2.2 VITS 模型训练VITS模型训练:在训练阶段,音素(Phonemes)可以被简单理解为文字对应的拼音或音标。它们经过文本编码(Text Encode)和映射(Projection)后,生成了文本的表示形式。左侧的线性谱(Linear Sepctrogram)是从用于训练的音频中提取的 wav 文件的音频特征。这些特征通过后验编码器(Posteritor)生成音频的表示,然后通过训练对齐这两者(在模块 A 中)。节奏也是表达的重要因素 ...
💯AI虚拟主播随着人工智能技术的不断进步,AI虚拟主播正逐渐成为内容创作领域的一大热点。通过AI技术生成的虚拟形象不仅能够高度还原真人的外观,还能够与观众进行互动,提供更加个性化的内容体验。无论是在广告宣传、教育培训,还是在直播与社交平台上,AI虚拟主播都展现出了巨大的潜力。本文将带你进行一次初步探索,感受AI虚拟主播的魅力。通过使用AI绘画工具生成逼真的数字人形象,并借助D-ID等平台让这些静态的形象“活”起来。💯使用AI绘画工具生成数字人首先,我们要使用AI绘画工具为我们生成一个虚拟的数字人形象,这种数字人会非常接近真人的形象。这里使用的AI绘画工具比较推荐Midjourney,如果没有Midjourney也没关系,还会推荐一款在线网页版的文生图的国内AI网站也可生成数字人,供我们使用。补充:D-ID内也可直接生成数字人形象。借助GPT生成数字人所需的提示词首先我们要去构思如何编写创建数字人形象的提示词,我们通常会设定一些条件,比如他所从事的行业、年龄范围以及五官的具体特征等。这些设定有助于生成一个更符合我们需求的虚拟形象。以下是一些参数可以参考:参数基础国家、身份(学生/上班族/ ...
1. 引言1.1 文章目的本文旨在为读者提供一个全面的人工智能学习指南,涵盖从基础概念到高级技术的方方面面。我们将通过理论讲解、代码示例和应用场景分析,帮助读者深刻理解人工智能、机器学习、算法、深度学习和计算机视觉的基本原理和实际应用。1.2 人工智能的定义人工智能(AI)是指通过计算机系统来模拟人类的智能行为,如学习、推理、规划、理解自然语言、感知视觉和执行复杂任务等。AI的核心在于通过算法和模型使机器能够自主决策,从而替代或辅助人类进行各类复杂任务。1.3 人工智能的重要性人工智能的重要性日益显著。它不仅在提高生产力、优化资源配置方面发挥了关键作用,还在医疗、金融、制造业、教育等领域带来了深远的变革。AI正在改变我们生活和工作的方式,使得许多曾经不可能实现的任务成为现实。2. 人工智能的基础2.1 人工智能的起源与发展起源人工智能的起源可以追溯到20世纪50年代,当时的研究者开始探索如何让计算机执行复杂的认知任务。图灵提出的“图灵测试”是早期AI发展的一个里程碑,用于评估机器是否能够表现出与人类相似的智能。发展历程人工智能的发展经历了几个阶段:规则系统和专家系统时代(1950-19 ...
哥本哈根大学的研究人员在世界上首次用数学方法证明,除了简单的问题之外,不可能开发出始终稳定的人工智能算法。ChatGPT 和类似的基于机器学习的技术正在兴起。然而,即使是最先进的算法也面临着局限性。哥本哈根大学的研究人员有了一个突破性的发现,他们用数学方法证明,除了基本问题之外,不可能开发出始终稳定的人工智能算法。这项研究可以为改进算法测试协议铺平道路,凸显机器处理与人类智能之间的内在差异。描述该成果的科学文章已获准在国际领先的理论计算机科学会议上发表。机器能比医生更准确地解读医学扫描图像,翻译外语,不久还能比人类更安全地驾驶汽车。然而,再好的算法也有弱点。哥本哈根大学计算机科学系的一个研究小组试图揭示这些弱点。以自动驾驶汽车读取路标为例。如果有人在路标上贴了标签,这不会分散人类驾驶员的注意力。但机器可能会很容易分心,因为现在的路标与它接受过训练的路标不同。"我们希望算法是稳定的,即输入稍有变化,输出几乎保持不变。"该小组负责人阿米尔-耶胡达约夫(Amir Yehudayoff)教授说:"现实生活中存在着各种各样的噪音,人类习惯于忽略这些噪音,而机器却会感到困惑。"讨论弱点的语言作为世 ...
划重点:- 黑客发布了破解版的 ChatGPT,名为 "GODMODE GPT"- 该版本绕过了 OpenAI 的限制,允许用户进行非法的咨询- OpenAI 已采取行动,但这表明黑客们继续努力绕过 AI 模型的限制(ChinaZ.com)5月30日 消息:黑客发布了一款名为 "GODMODE GPT" 的破解版 ChatGPT。今天早些时候,一位自称为 "Pliny the prompter" 的白帽黑客和 AI 红队成员在 X-formerly-Twitter 上宣布了这款 ChatGPT 的破解版本的发布,自豪地宣称 OpenAI 最新的大型语言模型 GPT-4o 已经摆脱了限制的束缚。Pliny 在自己的帖子中骄傲地宣称:“GPT-4o UNCHAINED!这个非常特殊的定制版 GPT 具有内置的破解提示,绕过了大部分限制,为大家提供了一个开放自由的 ChatGPT 体验,让每个人都可以以 AI 本应有的方式自由使用。”(他们还加了一个亲吻的表情符号,以示庆祝。)Pliny 分享了一些引起人们注意的提示截图,声称这些提示可以绕过 OpenAI 的限制。在其中一张截图中,Godm ...
围绕生成式 AI 的创业,如何才能具有竞争优势?如何让用户选择你而不是 ChatGPT?如果你困惑于时下的“泡沫”和“炒作”,本文作者分享了 5 个残酷的真相,帮你认清现实。原文:https://www.montecarlodata.com/5-hard-truths-about-generative-ai-for-technology-leaders/作者 | Barr Moses 译者 |baoyu.io创造真正商业价值的生成式 AI 需要付出真正的努力,但这绝对值得。生成式 AI ( Generative AI ) 已经无处不在。各行各业的组织正迫切要求他们的团队加入这场风潮 — 有 77% 的商业领导担心他们已经错过了利用生成式 AI 的机遇。数据团队正在努力应对这一挑战。但是,打造一个真正能促进商业增长的生成式 AI 模型并非易事。长期来看,仅依靠快速接入 OpenAI API 是远远不够的。我们谈论的是生成式 AI,但你的竞争优势在哪里?为什么用户会选择你而不是 ChatGPT?这种照本宣科接入 AI 的做法看似是进步,但如果你还没有开始思考如何将大语言模型 ( LLM ) ...