字节跳动 智能对话大模型算法工程师-生活服务-筋斗云人才计划(北京/上海/成都)

2025-06-10 17:25 更新

北京

正式

研发 - 算法

职位 ID:A12140


职位描述

团队介绍:生活服务业务依托于抖音、抖音极速版等平台,致力于促进用户与本地服务的连接。过去一年,生活服务业务开创了全新的视频种草和交易体验,让更多用户通过抖音发现线下好去处,也帮助众多本地商家拓展了新的经营阵地。我们期待你的加入,一同为亿万用户创造更美好的生活。 课题介绍:生活服务行业在数字化转型中面临效率提升和成本优化的迫切需求,传统商家依赖销售老师处理商品管理、订单咨询、营销推广等环节,存在响应速度慢、标准化程度低、人力成本高等痛点。基于大语言模型(LLM)的对话系统具备自然语言理解、多任务处理、知识推理等能力,可以为商家提供智能客服、流程自动化、数据分析等场景的解决方案。然而,现有通用模型在垂直领域应用中仍存在领域知识匮乏、复杂任务执行能力不足、多模态交互受限等问题,需结合RAG、Function Calling、多模态等技术进行针对性优化。 课题挑战/必要性: 生活服务行业规则多变(如季节性促销、政策调整),需设计低延迟的领域知识库动态更新机制。另外,商家需求多样,对Agent工具调用、动态规划与异常处理能力提出了很高的要求。同时,在交互中期望能够实现语音、图像、文本等多模态信息的内容理解能力与自然交互,解决语义一致性的难题。 


课题内容: 

1、RAG在垂直领域的优化:构建生活服务行业知识图谱与动态检索库,研究检索增强生成中的上下文压缩技术与深度思考技术,提升答案准确性; 

2、Function Calling与业务流程自动化:设计面向商家的工具库,支持自然语言指令到工具调用的精准映射,研究强化学习(RL)在工具调用领域的应用提升模型对领域外工具的识别泛化能力; 

3、对话Agent的决策与协作能力:研究基于强化学习(RL)优化Agent的任务规划能力,研究多Agent协作机制; 

4、多模态交互与生成:深入研究图像内容理解,开发能够与商家自然沟通的多模态交互与生成系统。


职位要求

1、获得博士学位,人工智能、计算机、数学相关专业优先; 

2、立志于将智能体的工业界落地,作为职业长期发展的目标; 

3、优秀的代码能力、数据结构和基础算法功底,熟练Python、C++等常用编程语言; 

4、智能编码方向要求有扎实的机器学习基础,在ICML/CVPR/NeurIPS/ACL等期刊会议上发表论文者优先; 

5、出色的问题分析和解决能力,面对困难勇于迎接挑战,有自主探索解决方案的能力; 

6、良好的沟通协作能力,能和团队一起探索新技术,推进技术进步。




以上内容是否对您有帮助:
在线笔记
App下载
App下载

扫描二维码

下载编程狮App

公众号
微信公众号

编程狮公众号