字节跳动 大模型应用框架研发工程师-Cross Platform-筋斗云人才计划
- 广州
- 正式
- 研发 - 算法
- 职位 ID:A101286
职位描述
团队介绍:
字节跳动Stone-Cross Platform团队成立于2023年,致力于开发业界前沿的应用框架,构建AI模型驱动的前沿系统和基础设施,提升开发者和用户体验。
课题介绍:
课题背景:
随着AI大模型研究的不断发展,文本生成、多模态理解以及Agent规划能力有了巨大的提升和突破,以豆包多模态交互、UI-TARS和Operator等GUI Agent、Deepseek-R1推理模型为典型案例,应用的构建以及交互方式迎来了巨大的机遇和变革。我们希望结合AI模型的多模态理解和生成、深度思考,深入AI Agent所需的交互和基础设施,探索大模型在AI应用构建效率和为智能交互体验上的创新。
研究方向:
本课题旨在利用大模型技术开发智能应用交互框架,研究内容包括:围绕大模型设计应用框架,利用大模型提升应用构建效率,如UI理解及代码生成等;
使用大模型来理解应用的多模态context及用户意图,进行意图规划及推理执行,完成用户交互;优化编程语言的设计,使其容易被大语言模型理解,自动验证和实现编程语言的自动生成,和编程语言之间的相互转译,从而加速新编程语言生态的构建;
通过该课题的研究,我们希望实现更加智能、便捷和高效的应用框架,推动AI驱动的应用交互的普及与发展。
1、参与大模型在应用框架中的算法研究,探索和优化模型对应用的理解和生成能力、AI Agent等技术;
2、研究和开发智能UI交互技术,提升GUI Agent的智能水平、UI的智能化交互和个性化水平;
3、设计跨平台、高性能、大模型便于理解和生成的编程语言;
4、建设和优化应用中Agent Context、Planning、Tool using等能力,提升应用的理解和响应水平;
5、探索多模态数据融合技术,解决复杂场景下的精准推理与决策问题;
6、整理研究数据,撰写技术报告和发表研究论文。
职位要求
1、获得博士学位,人工智能、计算机、自动化、数学、人机交互相关专业优先;
2、扎实的机器学习基础,熟悉NLP、RL领域的技术,在ACL/EMNLP/NAACL/NeurIPS/ICML/ICLR等顶级会议上发表论文者优先;
3、优秀的代码能力、数据结构和基础算法功底,熟练Python或Javascript,有开源项目经验和ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先;
4、理解编程语言的基础理论,包括形式语言和自动机理论、类型系统和语义学,有语言设计经验并在编程语言相关顶级会议(PLDI/OOPSLA/ICFP/POPL/ECOOP等)发表过论文的优先;
5、出色的问题分析和解决能力,能深入解决大模型训练和应用存在的问题,有自主探索解决方案的能力;
6、良好的沟通协作能力,能和团队一起探索新技术,推进技术进步。
更多建议: