谷歌发布史上最大“通才”AI模型,可让机器人更自主
(相关资料图)
3月8日消息,据财联社报道,谷歌和柏林工业大学的团队重磅推出了史上最大的视觉语言模型——PaLM-E,参数量高达5620亿(GPT-3的参数量为1750亿)。
作为一种多模态具身视觉语言模型(VLM),PaLM-E不仅可以理解图像,还能理解、生成语言,可以执行各种复杂的机器人指令而无需重新训练。
谷歌研究人员计划探索PaLM-E在现实世界场景中的更多应用,例如家庭自动化或工业机器人。他们希望PaLM-E能够激发更多关于多模态推理和具身AI的研究。
关键词:

全球简讯:蜂花回应要认养大熊猫丫丫:事情属实,还没有找到具体负责人对接可行性问题


谷歌发布史上最大“通才”AI模型,可让机器人更自主


消息称Shein将在本月进行一轮融资,融资规模约为20亿美元


万科回应分红规划:30%是底线要求,争取维持在35%左右_世界头条


肉串汪回应轻熟女文案侮辱女性:没有不尊重女性的意思,已下架-今日关注


董明珠谈女性年龄焦虑:心态很重要,我70岁了梦想还在

相关新闻