【资料图】
8月25日消息,阿里云今日推出大规模视觉语言模型Qwen-VL,并对其直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发,支持图文输入。
相较于此前的VL模型,Qwen-VL除了具备基本的图文识别、描述、问答及对话能力之外,还新增了视觉定位、图像中文字理解等能力,可用于知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等场景。(电商报)
关键词:
Copy 2006-2020 太平洋商业网
联系邮箱:939 674 669@qq.com
豫ICP备2022016495号-17 营业执照公示信息
声明:本站所有文章、数据仅供参考,使用前务请仔细阅读法律声明,风险自负。
相关新闻