RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic Control

发布时间:2023-07-29  栏目:LLM, 机器人  评论:0 Comments

RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic Control RT-2: Vision-Language-Action Models (robotics-transformer2.github.io)

Learning Agile Soccer Skills for a Bipedal Robot with Deep Reinforcement Learning

发布时间:2023-05-04  栏目:AI应用领域, 人工智能, 机器人  评论:0 Comments

OP3 Soccer (google.com)

芯片设计流程

发布时间:2023-04-05  栏目:机器人, 芯片设计  评论:0 Comments

参考:https://blog.csdn.net/qq_36045093/article/details/124659801   EDA是电子设计自动化(Electronics Design Automation)的缩写,在20世纪60年代中期从计算机辅助设计(CAD)、计算机辅助制造(CAM)、计算机辅助测试(CAT)和计算...

关于ChatGPT的一点初步思考

发布时间:2023-01-29  栏目:AI应用领域, VideoConference, 人工智能, 元宇宙, 智能问答, 机器人, 深度学习, 自然语言处理  评论:0 Comments

深度学习应该是有很多瓶颈的,那么为啥ChatGPT可以是实现类似于质的飞跃?真的只是因为它有比较大的量和做了表面的优化(强化学习)这个吗?   个人初步感觉,words可能比图像输入有更强的condition和context信息,特别是如果融合前后3000...

一句话生成3D模型

发布时间:2022-11-27  栏目:AI应用领域, 人工智能, 元宇宙, 图像处理, 机器人, 机器视觉, 深度学习  评论:0 Comments

英伟达“一句话生成3D模型”碾压谷歌:分辨率清晰8倍,速度快2倍 (qq.com)

Create videos from plain text in minutes as virtual support agents

发布时间:2022-11-09  栏目:AI应用领域, 人工智能, 元宇宙, 智能问答, 机器人  评论:0 Comments

Synthesia | #1 AI Video Generation Platform

Event-aided Direct Sparse Odometry

发布时间:2022-05-07  栏目:ADAS, AI应用领域, 图像处理, 机器人, 机器视觉  评论:0 Comments

Event-aided Direct Sparse Odometry (uzh.ch)

语义分割、实例分割与全景分割

发布时间:2021-10-13  栏目:ADAS, 人工智能, 图像处理, 机器人, 机器视觉, 深度学习  评论:0 Comments

-语义分割 -实例分割 -全景分割任务(Panoptic Segmentation) 全景分割任务要求图像中的每个像素点都必须被分配给一个语义标签和一个实例id,其中,语义标签指的是物体的类别,而实例id则对应同类物体的不同编号。

激光雷达与摄像头融合

发布时间:2021-06-23  栏目:人工智能, 数据融合  评论:0 Comments

是激光雷达点云转到图像做融合好?还是图像转到激光雷达检测坐标系比较好? 激光雷达点云为什么要先转成俯视图再处理?

PCL点云库(Point Cloud Library)

发布时间:2021-04-11  栏目:图像处理, 机器人, 机器视觉  评论:0 Comments

PCL(Point Cloud Library)是在吸收了前人点云相关研究基础上建立起来的大型跨平台开源C++编程库,它实现了大量点云相关的通用算法和高效数据结构,涉及到点云获取、滤波、分割、配准、检索、特征提取、识别、追踪、曲面重建、可视化等。支持多...

自然表情响应

发布时间:2021-01-21  栏目:人工智能, 机器人  评论:0 Comments

自然表情响应,英文名称为“Natural Facial Expression Response”,英文缩写为NFER, 由人工智能科学家杨文龙(即我自己,哈哈)在2021年1月21日(即今天)提出。主要指人工智能(如虚拟机器人或实体机器人)在对环境(他人的自然语言、表情情绪及相...

相册集

pix pix pix pix pix pix

关于自己

杨文龙,微软Principal Engineering Manager, 曾在各家公司担任影像技术资深总监、数据科学团队资深经理、ADAS算法总监、资深深度学习工程师等职位,热爱创新发明,专注于人工智能、深度学习、图像处理、机器学习、算法、自然语言处理及软件等领域,目前发明有国际专利19篇,中国专利28篇。

联系我

个人技术笔记

290125097@qq.com

2015 in Shanghai