Last Updated: 2024.08.19
Email: wjj1020181822@toki.waseda.jp
WeChat: 18128590280
目录
- 介绍 Bio
- 目录
- 教育经历 Education
- 项目经历 Projects
- 履历 Employment History
- 2023年10月-2024年2月
- 2021年10月-2023年3月
- 2021年05月-2021年10月
- 2019年02月-2020年06月
- 论文 Papers
- 专业服务 Professional Services
- 证书
教育经历 Education
博士 2021.09-2024.09 日本早稻田大学
兼清华大学客座学生。研究方向: 基础大模型(大多模态模型,大语言模型), 人类价值观对齐。
硕士 2019.09-2021.09 日本早稻田大学
研究方向:自然语言处理,多模态。
毕业论文:Learning Multimodal Interaction Representations from Trilinear Transformers for Visual Question Answering
本科 2015.09-2019.09 日本早稻田大学
毕业论文:Toxic Comment Classification Challenge based on CNN, RNN and BERT
项目经历 Projects
工程项目
- 多模态数据:Open-sora
- 多模态模型:太乙系列模型(中文stable diffusion)
- 开源模型:封神榜项目
- 其他小项目
学术项目(目标:产出论文/影响力)
- 下一代多模态数据集:PIN格式
- 和清华大学的科研合作:多模态模型,多模态基准,NLP中的伦理判断
- 和IDEA研究院的科研合作:基于标签的NLU模型,基于信息抽取的NLU模型,大模型数学推理
- 其他合作:基于结构化数据的LLM,多模态大模型评基准
履历 Employment History
2023年10月-2024年2月
HKUST研究助理(指导老师:付杰)
- 科研合作
- 协助团队管理
- 日常事务
2021年10月-2023年3月
粤港澳大湾区数字经济研究院 CCNL-认知计算与自然语言研究中心
算法研究实习生
也是CCNL的第一个实习生
主要工作内容:致力于研究AIGC相关的基础模型,比如,统一的语言模型、多模态大模型。
封神榜开源计划
Github: ‣
Huggingface: https://huggingface.co/IDEA-CCNL
如,太乙系列大模型,UniMC等。
相关报道:
现在已经开源了超过100个模型。
2021年05月-2021年10月
深圳市腾讯计算机系统有限公司 CDG-广告产品技术部 策略算法实习生
主要工作内容:多模态广告推荐相关的研究 (多模态图神经网络, 已中ACM MM 2022)
2021腾讯广告算法大赛初赛
2021腾讯广告算法大赛复赛(内部赛道季军)
2019年02月-2020年06月
日本东京 TC教育 IT总工程师
日本东京 择优进学塾 IT总工程师
为了给学生们提供一个良好的在线学习环境,搭建一个可以支持大约200人的网校平台,比如给国内和在日本的学生提供顺畅的视频服务等; 为了教师方便管理学生档案,搭建学生管理系统,可以支持档案的提取更改等,并且可以支持学生的本科一直到求职; 承担教学工作,辅导研究生同学寻找合适的博士学校。课程主要为: CV,NLP,Python等。
论文 Papers
现在正在进行:
多模态数据
PIN: A Knowledge-Intensive Dataset for Paired and Interleaved Multimodal Documents
后续工作:数据比例,多模态训练策略,多模态模型等。
专业服务 Professional Services
会议审稿员
- The 47th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR 2024)
- The Conference on Empirical Methods in Natural Language Processing (EMNLP 2023)
期刊审稿员
- IEEE Transactions on Circuits and Systems for Video Technology (TCSVT 2023)
教程讲师 (Tutorial Speaker)
青年研究员
2023, 青绿计划项目, 世青峰智库
提供一些关于低碳和AI的前沿见解和交流
特邀作者
2023, Readpaper
2023.4 - 2024.2
主要内容是:论文阅读,学术趋势等
组织者
负责WWW-4任务的构建,完成标注页面,组员合作等。
针对用户提供的主题,进行网页的排名检索。
这个任务主要是即时网络搜索(即针对给定的搜索主题进行网页的排名检索),其中包括中文和英文子任务。任务的目标是量化网络搜索技术的进步(以搜索引擎结果页面“首屏”的质量为标准),并解决可重复性(即某个研究小组X报告的结果能否在相同数据上被研究小组Y复现)和可再现性(即某个研究小组X报告的结果能否在不同数据上被研究小组Y再现)的问题。
证书
(大概是大一大二期间获得的MOOC证书,约40张)