致力于计算机视觉、机器人与各类智能技术交叉融合,故命名为 “视觉机器人与智能技术”实验室,但 “视觉机器人” 一词暂无严格的学术...
计算摄影是利用数字计算结合传感器及光学等技术创造出新型摄影设备以及相关应用的综合技术。 智能终端计算摄影系统可通过成像控制、图...
研究面向真实世界和数字世界的具身智能体(计算摄影机器人)和软件智能体,核心模块:感知与观测,记忆与检索,推理与规划,行动与执行...
实验室获视觉顶会CVPR RHOBIN 2025 人物交互重建: 5冠2亚
CCF-A国际多媒体顶会ACM MM2024,多模态人体动捕挑战赛,三个冠军:单目视频动捕赛道、视频+惯性动捕赛道、惯性动捕赛道。...
实验室获视觉顶会CVPR RHOBIN 2024 人物交互重建:赛道1 (亚军)/赛道3 (冠军)/赛道5 (第4)
实验室牵头获CVPR NTIRE 2024 AIGC质量评价—图像赛道 (冠军) / 视频赛道 (第5)!
实验室组织1个本科生牵头的队伍参加了CVPR NTIRE 2024 Short-form 视频质量评估比赛,获得前十 (第9)!...
Quality Assessment of Video Enhancement Challenge:实验室应邀参与了淘宝音视频技术的参赛队伍「TB-VQA」,2020级硕士生肖鹏翔作为...
已签约机械工业出版社,预计2023年出版。这是《移动机器人开发技术(激光SLAM版)》的姊妹篇,希望有助于同行们培养初步掌握移动机器人...
2022年机械工业出版社出版(第一版),这是一本凝聚实验室人才培养经验的教材,希望有助于同行们培养初步掌握移动机器人开发技术的学生...
"Metadata for image aesthetics assessment with aesthetic attributes in mobile terminal computational photography system"...
Multi-camera data collection and annotation for AWB enhancement in mobile terminal computational photography system...
Reference architecture for mobile terminal computational photography system...
颜色是视觉信息中最为基础也最为直接的特征之一,但颜色特征也是一种极不稳定的视觉特征,很容易受到光照颜色变化的影响,颜色恒常性计...
牛津词典将美学定义为:“concerned with beauty and art and the understanding of beautiful things, and made in an artistic way a...
图像美学摄制 (Aesthetic Shooting/Generating) 是以人为中心的计算摄影关键技术,主要研究知识与数据双轮驱动的摄制,人体动作捕捉,...
研究面向自动摄影的具身智能体,包括开放世界物体感知、物理世界数字孪生、知识与数据驱动的推理与决策、基于强化学习的摄影执行、记忆...
打造视觉审查智能体平台,从图像看得清、看得懂到视频看得透,实现从图像目标感知到视频时空理解的跨越。
研究在嵌入式平台将基于视觉计算的可行域与障碍物检测、BEV感知与避障等算法落地。
面向工业需求,开展“计算摄影应用落地”的研发。
受企业委托,研发单目视频动作捕捉与渲染系统并上线运营,实现低成本、快速、高质量捕捉动作并绑定为虚拟人,各类指标应领先于国内外同...
面向视频监控场景,根据6个质量指标(清晰度、噪声、对比度、亮度、色彩还原、色彩饱和度),分别采用不同的计算方法来对测试素材进行...
采用联合研发工作组的方式,研究动作运动韵律增强方法,通过高质量、低成本的动作节奏数据集标注,提出了适合提取舞蹈动作特征的深度学...
在疫情期间,家庭健身已成为一个显著的趋势,并获得了广泛关注。然而,现有的健身助手系统主要遵循传统“命令-输出”交互模型,其输出...
视觉机器人与智能技术实验室自主设计、完全开源的mRobotit移动机器人平台,主要面向教学和学习场景,具有成本低、结构精简等特点,平台...
采用联合开发工作组的组织方式,打造智能制造系统,包括:智能制造及衍生平台标准化设计与整体规划、设备和软件选型、软件及算法研发、...
社区媒体是融入社区场景中,形成网络化布局,精准到家的生活圈媒体。作为居民每天必经的生活场景,社区的媒体价值正在逐渐受到关注。拉...
本项目针对传统的“静态展示、说教式传播”的博物馆展示形式,难以满足现代参观者及历史文化传播的需求问题,研发面向博物馆藏品虚实融...
预研图书盘点机器人,总体结构共有九个模块,分别为人机交互模块、建图与定位模块、条码识别模块、通信模块、避障模块、盘点数据管理模...
基于大模型与知识图谱技术,采用联合开发工作组的组织方式,打造智慧机构服务系统、居家照护,数字化监控平台、自动化设备为一体的智慧...
深圳市泰衡诺科技有限公司由深圳传音控股投资组建,是深圳传音控股的全资研发子公司。联合实验室以计算摄影的相关研究作为工作重点。
以语音识别等技术为主的儿童陪伴机器人,陪伴儿童成长,结合寓教于乐的故事素材,提供趣味聊天。
主要研究领域为:1、深度视觉传感器技术;2、基于激光雷达/视觉传感器的SLAM技术;3、地图多分辨率分割、路径规划、避障等导航技术;4...
基于深度学习的远距离人脸识别 / 陌生人检测技术在嵌入式智能门禁系统中的应用。
2D视觉测距传感器,激光辅助标定。
包括:语义分割/分层、笔触模拟、纹理合成、图像矢量化、场景理解等。绘画机器人技术是机器视觉、绘画艺术、新型显示与印刷技术和认知...