识别猫微软论文解构gpt稚晖君创业公司智元机器人

数码
2024-10-13 13:39
0

AI在专业化的工程里，比如解开一个庞大的方程式，或者推算圆周率的后一百万位，其能力和效率足以秒杀全世界最聪明的头脑，但是你发给它一张猫的图片，问它能不能认得出来图上有一只猫，它根本就办不到，而在人类世界，这是3岁孩童的智力认知水平。谷歌的X-Lab项目名为「猫脸识别」，组建了10亿个神经网络节点，天天让AI去YouTube看猫片，实际效果却并不理想，比如准确率刚高起来，遇到苏格兰折耳猫就又会认不出来，因为AI觉得这种耳朵耷拉下去的动物和它理解的猫不一样。

一个识别猫狗的项目，google创建的MobileNet模型，基于ImageNet，由李飞飞团队创建的大型数据集。这个数据集有1400多万数据和超过2万多个标注，与超过百万的边界框标注。有监督学习。

·×：输入参数，32*32*3的数组，32是像素点的位置，3是RGB通道对应的三个值·W：权重·输出是10个类型分别对应的分数，如输入是一只猫，那么输出的对应猫的评分就会比较大·在参数模型中，我们要做的工作是总结我们对训练数据的认识并且把他们都运用在得出参数W在测试时，我们不再需要输入实际的训练数据，而是只需要得知函数，和输入需要测试的图像，就可以得出结果，效率大大提升

函数模型：f(x,W)=Wx b1.输入：32*32*3的三维数组，我们把它拉长为一个3072*1的列矩阵。2.我们想要得到的是10个类的得分，即输出需要是一个10*1的向量，因此根据矩阵的乘法规则，我们需要将W设置成10*3072的矩阵，因此10*3072*3072*1即可得到10*1的输出矩阵。3.我们会在Wx后面在偏差项bias（偏好值），bias也是10*1的向量。4.bias偏差项：设置偏好值，如果你更希望某一类图片被识别出来，那么就设置该类别的bias大一些，比如训练集中猫的图片比狗多，那猫的bias就设置的比狗大。5.一个权重矩阵相当于10个类的单独的分类器，分别代表着权重矩阵的每一行。6.线性分类器计算一个类的分数是所有3个颜色通道的所有像素值的加权和。

在网络抓取中，可能会有数千亿个单词；在已数字化的书籍中，可能还有数百亿个单词。但是，即使是对于 40,000 个常用单词，2 元单词序列的可能性已经达到了 16 亿个，而 3 元单词序列的可能性达到了 60 万亿个。因此，我们无法从已有的文本中估计出所有这些概率。而当我们涉及到由 20 个单词组成的“文章片段”时，可能性的数量已经超过了宇宙中的粒子数量，因此从某种意义上说，这些可能性永远无法被全部记录下来。

重要的想法是构建一个模型，让我们能够估计序列应该出现的概率——即使我们在查看的文本语料库中从未明确看到过这些序列。而 ChatGPT 的核心正是一种所谓的“大型语言模型”（LLM），它被构建出来以很好地估计这些概率。

模型，提供一种计算答案的方法，而不仅仅是测量和记住每种情况。

模型是内在规律的数学描述。

从来没有一个“无建模的模型”。你使用的任何模型都有一定的基本结构，然后有一组可以调整的“旋钮”（即可以设置的参数），以适应你的数据。在ChatGPT的情况下，使用了许多这样的“旋钮”——实际上有1750亿个。

智元机器人的创始人，正是去年从华为离职的“天才少年”——稚晖君。

此轮融资过后，有消息称智元机器人市场估值达十几亿美元。

三个月完成两轮融资，稚晖君在筹备一件大事

智元机器人成立2023年2月，是一家人形机器人研发商，主要将AI和机器人的深度融合，研发和生产通用人形机器人和具身智能等系列产品。

虽然仅成立三个月，消息称智元机器人已完成两轮融资，企业股东有14家，包括高瓴、奇绩创坛以及此次新增的百度、经纬、鼎晖、高榕等。

稚晖君肯定了自己未来坚定探索的方向就是AGI（通用人工智能）。

哪吒视频发布之后不久，智元机器人也开始正式对外招聘，社招岗位包括：算法工程师一一大模型LLM、机器人运动控制，硬件工程师，软件开发工程师一一C ，嵌入式开发工程师等。