简历 Resume

Posted on Sat, Oct 14, 2023 简历

介绍 Bio

现在:

【2021.09-2024.09】早稻田大学博士(指导老师:酒井哲也)

近期职位:

【2023-2024】HKUST研究助理(指导老师:付杰)

【2021-2023】IDEA CCNL 实习研究生,IDEA封神榜太乙系列模型负责人,封神榜单组织者

【2020-2022】清华大学 客座学生(指导老师:杨余久)

【2022】清华大学 实习RA (指导老师:刘奕群)

Last Updated: 2024.08.19

谷歌学术:https://scholar.google.com.hk/citations?user=iwR2MoQAAAAJ&hl=zh-CN

Email: wjj1020181822@toki.waseda.jp

WeChat: 18128590280

目录

教育经历 Education

博士 2021.09-2024.09 日本早稻田大学

兼清华大学客座学生。研究方向: 基础大模型(大多模态模型,大语言模型), 人类价值观对齐。

硕士 2019.09-2021.09 日本早稻田大学

研究方向:自然语言处理,多模态。

毕业论文:Learning Multimodal Interaction Representations from Trilinear Transformers for Visual Question Answering

本科 2015.09-2019.09 日本早稻田大学

毕业论文:Toxic Comment Classification Challenge based on CNN, RNN and BERT

项目经历 Projects

工程项目

详情:https://wanng-ide.github.io/projects.html

学术项目(目标:产出论文/影响力)

详情:https://wanng-ide.github.io/publications.html

履历 Employment History

2023年10月-2024年2月

HKUST研究助理(指导老师:付杰)

2021年10月-2023年3月

粤港澳大湾区数字经济研究院 CCNL-认知计算与自然语言研究中心

算法研究实习生

也是CCNL的第一个实习生

主要工作内容:致力于研究AIGC相关的基础模型,比如,统一的语言模型、多模态大模型。

封神榜开源计划

Paper:https://arxiv.org/abs/2209.02970

Github:

Huggingface: https://huggingface.co/IDEA-CCNL

如,太乙系列大模型,UniMC等。

相关报道:

太乙系列:https://mp.weixin.qq.com/s/WrzkiJOxqNcFpdU24BKbMA

Unimc:https://mp.weixin.qq.com/s/m0_W31mP4xKKla8jIwUXkw

现在已经开源了超过100个模型。

2021年05月-2021年10月

深圳市腾讯计算机系统有限公司 CDG-广告产品技术部 策略算法实习生

主要工作内容:多模态广告推荐相关的研究 (多模态图神经网络, 已中ACM MM 2022)

2021腾讯广告算法大赛初赛

2021腾讯广告算法大赛复赛(内部赛道季军

2019年02月-2020年06月

日本东京 TC教育 IT总工程师

日本东京 择优进学塾 IT总工程师

为了给学生们提供一个良好的在线学习环境,搭建一个可以支持大约200人的网校平台,比如给国内和在日本的学生提供顺畅的视频服务等; 为了教师方便管理学生档案,搭建学生管理系统,可以支持档案的提取更改等,并且可以支持学生的本科一直到求职; 承担教学工作,辅导研究生同学寻找合适的博士学校。课程主要为: CV,NLP,Python等。

论文 Papers

全部论文:https://wanng-ide.github.io/resume.html

现在正在进行:

多模态数据

PIN: A Knowledge-Intensive Dataset for Paired and Interleaved Multimodal Documents

后续工作:数据比例,多模态训练策略,多模态模型等。

专业服务 Professional Services

会议审稿员

期刊审稿员

教程讲师 (Tutorial Speaker)

International Conference on Neural Computing for Advanced Applications (NCAA 2023)

青年研究员

2023, 青绿计划项目, 世青峰智库

提供一些关于低碳和AI的前沿见解和交流

特邀作者

2023, Readpaper

2023.4 - 2024.2

主要内容是:论文阅读,学术趋势等

组织者

2022, NII Testbeds and Community for Information access Research (NTCIR-16)

负责WWW-4任务的构建,完成标注页面,组员合作等。

针对用户提供的主题,进行网页的排名检索。

这个任务主要是即时网络搜索(即针对给定的搜索主题进行网页的排名检索),其中包括中文和英文子任务。任务的目标是量化网络搜索技术的进步(以搜索引擎结果页面“首屏”的质量为标准),并解决可重复性(即某个研究小组X报告的结果能否在相同数据上被研究小组Y复现)和可再现性(即某个研究小组X报告的结果能否在不同数据上被研究小组Y再现)的问题。

证书

(大概是大一大二期间获得的MOOC证书,约40张)