Transformer结构用于大模型的优点
发布时间:2024-02-22 栏目:LLM, 人工智能 评论:0 Comments
有长短期依赖(attention机制) 每个单元相当于一个小模型,方便排列组合 输入输出可变长度
关于AGI的一点感想
发布时间:2023-12-12 栏目:LLM, 感悟 评论:0 Comments
生命是沉重的 职责越大,由于道德悖论等问题,会越来越不知行合一,进而对自己产生负面的情感影响(脱掉帽子,人都是一样的情感和喜好;但是职责,特别是管理职责会让人无法直接面对这些),反噬也就越大 人类思绪的结合体,仍然是有情感的或者...
AI在高维空间上对人类可能碾压
发布时间:2023-11-19 栏目:LLM, 人工智能 评论:0 Comments
一点感想: transformer和ChatGPT只不过是一个编码解码器结构,输出训练也只是用的对其技术,似乎并没有什么特别的。 2016年,AlphaGo与李世石的对战中走的第37步,大多人类围棋选手都没看懂,它之所以能做到这一点,除了表面上的基于强化学习的...
一些有趣的LLM试用网站
发布时间:2023-11-06 栏目:AI应用领域, LLM, 人工智能 评论:0 Comments
Fast Stable Diffusion – a Hugging Face Space by prodia Zephyr Chat – a Hugging Face Space by HuggingFaceH4 Wonder3D – a Hugging Face Space by flamehaze1115 Image Animation Using Thin Plate Spline Motion Model...
关于LLM使用方式的一些总结
发布时间:2023-10-31 栏目:AI应用领域, LLM, 人工智能 评论:0 Comments
目前总结下来ChatGPT运行比较好的一些方面: – 作为新信息的查询来源,类似于搜索引擎或者客服的角色 – 写初步的代码,比如Github copilot – 会议总结、文档初稿、信息提要等功能 – 免费的专家系统,可以咨询或者顾问任...
RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic Control
发布时间:2023-07-29 栏目:LLM, 机器人 评论:0 Comments
RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic Control RT-2: Vision-Language-Action Models (robotics-transformer2.github.io)
Bloom
发布时间:2023-05-14 栏目:AI应用领域, LLM, 人工智能 评论:0 Comments
BLOOM is an autoregressive Large Language Model (LLM), trained to continue text from a prompt on vast amounts of text data using industrial-scale computational resources. As such, it is able to output coherent text in 46 langua...
MosaicML
发布时间:2023-05-08 栏目:LLM, 人工智能 评论:0 Comments
Introducing MPT: a new family of open-source commercially usable LLMs from MosaicML. Trained on 1T tokens of text+code, MPT models match and – in many ways – surpass LLaMa-7B. This release includes four models: MPT-...
针对最近LLM观点的几点个人看法
发布时间:2023-05-04 栏目:AI应用领域, LLM, 人工智能, 感悟 评论:0 Comments
针对最近一些思想的几点个人看法(仅代表个人观点): – 涌现只是现象,不是本质原因也不是科学解释,个人不赞同无脑的把未知的东西都简单归结为涌现 – AI带来的生产力的大幅提升,其冲击力仍需消化,可能极大的改变我们未来几十年...
A brief history of LLaMA models
发布时间:2023-05-04 栏目:LLM, 人工智能, 软件、框架及系统 评论:0 Comments
A brief history of LLaMA models – AGI Sphere (agi-sphere.com)
近期评论
- Pika发表在《莫里斯蠕虫(Morris Worm)》
- Pika发表在《多组学科研分析》
- crisy发表在《最近关于专利的一点感想》
- walter发表在《机器学习基础知识回顾-马尔科夫过程(Markov Process)》
文章归档
- 2024年3月
- 2024年2月
- 2023年12月
- 2023年11月
- 2023年10月
- 2023年9月
- 2023年8月
- 2023年7月
- 2023年6月
- 2023年5月
- 2023年4月
- 2023年3月
- 2023年2月
- 2023年1月
- 2022年12月
- 2022年11月
- 2022年9月
- 2022年8月
- 2022年7月
- 2022年6月
- 2022年5月
- 2022年3月
- 2022年2月
- 2022年1月
- 2021年12月
- 2021年11月
- 2021年10月
- 2021年9月
- 2021年8月
- 2021年7月
- 2021年6月
- 2021年5月
- 2021年4月
- 2021年2月
- 2021年1月
- 2020年12月
- 2020年11月
- 2020年10月
- 2020年8月
- 2020年7月
- 2020年6月
- 2020年5月
- 2020年4月
- 2020年3月
- 2020年2月
- 2019年7月
- 2019年5月
- 2019年3月
- 2019年1月
- 2018年6月
- 2018年5月
- 2018年4月
- 2018年3月
- 2018年2月
- 2017年11月
- 2017年7月
- 2017年6月
- 2017年5月
- 2017年3月
- 2016年12月
- 2016年11月
- 2016年10月
- 2016年9月
- 2016年8月
- 2016年7月
- 2016年6月
- 2016年5月
- 2016年4月
- 2016年3月
- 2016年2月
- 2016年1月
- 2015年12月
- 2015年11月