杨文龙的博客 » LLM - 个人技术笔记 - 热爱创新发明，专注机器学习、算法、深度学习、自然语言处理及人工智能

Transformer结构用于大模型的优点

发布时间：2024-02-22 栏目：LLM, 人工智能评论：0 Comments

有长短期依赖（attention机制）每个单元相当于一个小模型，方便排列组合输入输出可变长度

关于AGI的一点感想

发布时间：2023-12-12 栏目：LLM, 感悟评论：0 Comments

生命是沉重的职责越大，由于道德悖论等问题，会越来越不知行合一，进而对自己产生负面的情感影响（脱掉帽子，人都是一样的情感和喜好；但是职责，特别是管理职责会让人无法直接面对这些），反噬也就越大人类思绪的结合体，仍然是有情感的或者...

AI在高维空间上对人类可能碾压

发布时间：2023-11-19 栏目：LLM, 人工智能评论：0 Comments

一点感想： transformer和ChatGPT只不过是一个编码解码器结构，输出训练也只是用的对其技术，似乎并没有什么特别的。 2016年，AlphaGo与李世石的对战中走的第37步，大多人类围棋选手都没看懂，它之所以能做到这一点，除了表面上的基于强化学习的...

一些有趣的LLM试用网站

发布时间：2023-11-06 栏目：AI应用领域, LLM, 人工智能评论：0 Comments

Fast Stable Diffusion – a Hugging Face Space by prodia Zephyr Chat – a Hugging Face Space by HuggingFaceH4 Wonder3D – a Hugging Face Space by flamehaze1115 Image Animation Using Thin Plate Spline Motion Model...

关于LLM使用方式的一些总结

发布时间：2023-10-31 栏目：AI应用领域, LLM, 人工智能评论：0 Comments

目前总结下来ChatGPT运行比较好的一些方面： – 作为新信息的查询来源，类似于搜索引擎或者客服的角色 – 写初步的代码，比如Github copilot – 会议总结、文档初稿、信息提要等功能 – 免费的专家系统，可以咨询或者顾问任...

RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic Control

发布时间：2023-07-29 栏目：LLM, 机器人评论：0 Comments

RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic Control RT-2: Vision-Language-Action Models (robotics-transformer2.github.io)

Bloom

发布时间：2023-05-14 栏目：AI应用领域, LLM, 人工智能评论：0 Comments

BLOOM is an autoregressive Large Language Model (LLM), trained to continue text from a prompt on vast amounts of text data using industrial-scale computational resources. As such, it is able to output coherent text in 46 langua...

MosaicML

发布时间：2023-05-08 栏目：LLM, 人工智能评论：0 Comments

Introducing MPT: a new family of open-source commercially usable LLMs from MosaicML. Trained on 1T tokens of text+code, MPT models match and – in many ways – surpass LLaMa-7B. This release includes four models: MPT-...

针对最近LLM观点的几点个人看法

发布时间：2023-05-04 栏目：AI应用领域, LLM, 人工智能, 感悟评论：0 Comments

针对最近一些思想的几点个人看法（仅代表个人观点）： – 涌现只是现象，不是本质原因也不是科学解释，个人不赞同无脑的把未知的东西都简单归结为涌现 – AI带来的生产力的大幅提升，其冲击力仍需消化，可能极大的改变我们未来几十年...

A brief history of LLaMA models

发布时间：2023-05-04 栏目：LLM, 人工智能, 软件、框架及系统评论：0 Comments

A brief history of LLaMA models – AGI Sphere (agi-sphere.com)

相册集

关于自己

杨文龙，微软Principal Engineering Manager, 曾在各家公司担任影像技术资深总监、数据科学团队资深经理、ADAS算法总监、资深深度学习工程师等职位，热爱创新发明，专注于人工智能、深度学习、图像处理、机器学习、算法、自然语言处理及软件等领域，目前发明有国际专利19篇，中国专利28篇。

联系我

个人技术笔记

290125097@qq.com

2015 in Shanghai

个人技术笔记

Transformer结构用于大模型的优点

关于AGI的一点感想

AI在高维空间上对人类可能碾压

一些有趣的LLM试用网站

关于LLM使用方式的一些总结

RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic Control

Bloom

MosaicML

针对最近LLM观点的几点个人看法

A brief history of LLaMA models

近期文章

近期评论

文章归档

分类目录

功能

热情读者

作者其他介绍

友情链接

相册集

关于自己

联系我