王子豪

博士研究生 Jan 07, 2023

博士生/PhD Studet-2021

学习经历:

研究领域:人工智能音乐生成、语音合成、音频理解、音乐治疗.

2021-至今 浙江大学 - 计算机科学与技术学院

2017-2021 山东大学 - 计算机科学与技术专业

研究成果 (截止2024年11月):

[1]SongDriver: 消除逻辑延迟和误差累积的实时伴奏生成

SongDriver: Real-time Music Accompaniment Generation without Logical Latency nor Exposure Bias. ACMMM 2022 Oral. (CCF-A) Main Conference. Full paper. 浙大国家自然科学基金支持. 第一作者.

[2] MuChin: 音乐领域语言模型的通俗描述理解能力评测基准

MuChin: A Chinese Colloquial Description Benchmark for Evaluating Language Models in the Field of Music. IJCAI 2024 Oral. (CCF-A) Full Paper. 对牛弹琴-浙大合作, 第一作者.

[3] REMAST: 基于实时情感变化序列的歌曲柔和过渡改编生成

REMAST: Real-time Emotion-based Music Arrangement with Soft Transition. IEEE Transaction on Affective Computing (情感计算领域顶刊, 影响因子9.6,JCR Q1区, 中国科协T1) . 浙大国家自然科学基金支持. 第一作者.

[4] MuDiT & MuSiT: 描述到歌曲生成单阶段模型与人类通俗表达的对齐

MuDiT & MuSiT: Alignment with Colloquial Expression in Description-to-Song Generation. WWW (Under Review) .第一作者.

[5]   SaMoye:基于特征分解和合成的zero-shot歌声音色转换.

SaMoye: Zero-shot Singing Voice Conversion Based on Feature Disentanglement and Synthesis. ICLR (Under Review) 第一作者

[6] MetaBGM: 整合动态环境感知和个人偏好的元宇宙开放世界游戏场景实时背景音乐生成

MetaBGM: Real-Time Metaverse Game Cinematic Soundtrack Generation Integrating Ambient Awareness and Personalized Experience. ICASSP (Under Review) 共同一作.

[7] MelodyGLM: 融入长短mask的符号旋律生成的大规模多任务预训练框架

MelodyGLM:a large-scale multi-task pre-training framework for symbolic melody generation. PAMI(Under Review) 共同作者.

[8] Sketchffusion: 基于扩散模型的草图引导图像编辑生成.

Sketchffusion: Sketch-guided Image Editing With Diffusion Model. ICIP 2023 (CCF-C). 共同作者.

[9] 基于增强型多尺度编码卷积神经网络的海量光谱自动分类网络.

Automated Classification of Massive Spectra Based on Enhanced Multi-Scale Coded Convolutional Neural Network. Universe期刊. SCI Q2. 山大国家自然科学基金支持, 共同作者.

创业经历:

“爱写歌”原创音乐社区APP -  创始人&CEO

竞赛获奖:

²  互联网+ 创新创业大赛  国家银奖、省级金奖(队长 1/10,队伍排名前0.012%)

²  挑战杯 创业计划竞赛 国家铜奖、省级银奖(队长 1/10)

²  数字媒体科技作品创意竞赛 国赛一等奖(指导老师)

发明专利、设计专利、商标、软著等

²  发明专利. “一种即兴伴奏生成装置” CN114898725A. 第一作者

²  发明专利.“一种音乐创作辅助装置” CN114724534A. 第一作者

²  设计专利.“用于歌曲创作的图形用户界面” CN306328717S.  第一作者

²  图形商标.“ài” TMZC60807296D01T220604. 持有人.

²  软件著作权.“My Voice v1.0” 2019SR0870516. 第一作者

²  软件著作权.“Midilib-Autotune – Mobile V1.0” 第一作者

²  软件著作权."实时伴奏 - Web V1.0"  第一作者

才虫AI音乐生成大模型 - 联合创始人&技术总裁

²  国家互联网信息办公室-AIGC深度合成服务算法备案 - 算法安全责任人&申报材料撰写人.

²  北京市经济和信息化局合作项目: 全球数字经济大会Global Digital Economy Conference 2024-开幕式MV主题曲《数字北京欢迎您》-歌曲项目负责人.

其他经历:

浙江大学期间:

²  五好研究生、优秀研究生、龙湖奖学金、优秀博士奖学金、创新创业单项奖学金、设计和时尚基金奖学金.

²  计算机学院21级博士1班班长, 优秀学生干部 , 优秀团员.

²  ACM MM、ICLR、WWW、IJCAI审稿人.

²  2023年CSMT受邀汇报

²  2023年赴日本多所大学交流,于千叶大学进行学术报告.

²  https://www.mittrchina.com/news/detail/13887

²  https://mp.weixin.qq.com/s/I7E8ajpcgDxccEDAPmIm4g

²  https://scholar.google.com.hk/citations?user=aeBFmGEAAAAJ&hl=zh-CN

山东大学期间:

²  校长奖学金、十大年度人物、宝钢奖学金(山大共4名本科生)等.

²  GPA 88.23. 英语CET-6 500+,CET-4 500+

²  腾讯音乐人 爱好吉他/唱歌, 曾参与校级毕业晚会演出.

²  https://mp.weixin.qq.com/s/xyRU3s6lAeKIs8jjZR5hqw

²  https://mp.weixin.qq.com/s/dZVCWDtIVvC4xLyYjZfarw

联系方式carlwang@zju.edu.cn

NEXT

科技设计实验室

Great! You've successfully subscribed.
Great! Next, complete checkout for full access.
Welcome back! You've successfully signed in.
Success! Your account is fully activated, you now have access to all content.