当前位置: 公司首页>>团队队伍>>在职教师>>正文

巫思杏(讲师)

时间:2023年02月20日 15:15 浏览次数:[]

基本信息

姓名:巫思杏

职称:讲师

系所:人工智能系

研究领域:自然语言处理、人工智能

电子邮箱:wusixing@ynu.edu.cn

更新日期:20232月

 

巫思杏,1993年出生,云南昆明人,计算机软件与理论理学博士。2015年本科毕业于BWIN必赢软件工程专业,获得工学学士学位,并于同年考研进入北京大学,师从李影教授和吴中海教授。随后,于2018年在北京大学软件与微电子学院获得软件工程专业工程硕士学位,于2022年在北京大学计算机学院获得计算机软件与理论专业理学博士学位。主要研究方向是自然语言处理,具体包含开放域对话生成、文本生成、多源知识融合等研究任务。 共计发表20余篇(国际学术论文并获得一项发明专利,其中13篇一作文章发表在自然语言顶级会议(ACL、EMNLP、COLING),人工智能顶级会议(IJCAI),数据挖掘顶级会议(WSDM),对话语音交互顶级会议/Trans期刊(ICASSP , ITASLP),另外2篇文章发表于CCF-C类会议。近年来,连续受邀参与IJCAI、ACL、EMNLP、AAAI、NLPCC等国内外顶级会议的审稿工作。

教育背景

2011.09-2015.07 必赢电子游戏网站 BWIN必赢,软件工程,本科

2015.09-2018.07 北京大学 软件与微电子学院,软件工程,硕士 (导师:李影 教授、博导)

2018.09-2022.07 北京大学 计算机学院,计算机软件与理论,理学博士 (导师:吴中海/李影 教授、博导)

 

工作(实习)背景

2016-2018        微软亚洲研究院 MSRA,研究实习生

2022.09-至今     必赢电子游戏网站 BWIN必赢,讲师

 

主要研究方向

本人主要以自然语言处理为主要研究方向,欢迎有志于科研且希望从事自然语言处理研究(对话生成、文本生成、比赛解说、预训练语言模型等)的本科生、硕士研究生

 

1、开放域对话生成技术:开放域对话生成建模技术、未登陆词问题优化、知识融合的对话生成技术等。

2、文本生成技术:数据到文本技术(Data-to-Text)、游戏/赛事解说生成、文本隐写生成等。

3、预训练语言模型应用:预训练语言模型的训练、优化与应用。

 

学术成果

作为主要完成人的研究成果

 

S18.【CCF-B类数据挖掘会议,长文,一作】 Sixing Wu,  Ping Xue, Ye Tao, Ying Li, and Zhonghai Wu: Select, Extend, and Generate: Generative Knowledge Selection for Open-Domain Dialogue Response Generation,DASFAA 2023.

S17.【CCF-B类数据挖掘会议,短文,通讯(一作为所指导硕士)】 Fanxiao Li, Sixing Wu*,  Jiong Yu, Shuoxin Wang, Bingbing Song, Renyang Liu, Haoseng Lai, and Wei Zhou: Rewriting-Stego:  Generating  Natural and Controllable Steganographic Text  with Pre-trained Language Model, DASFAA 2023.

S16.【CCF-B类期刊,SCI一区(发表时),SCI二区(现在),长文,一作】Sixing Wu, Ying Li, Dawei Zhang, Zhonghai Wu: Generating Rational Commonsense Knowledge-Aware Dialogue Responses with Channel-Aware Knowledge Fusing Network IEEE/ACM Transactions on Audio, Speech and Language Processing, 2022.

S15.【CCF-B类自然语言会议,长文,一作】Sixing Wu, Ying Li, Ping Xue, Dawei Zhang and Zhonghai Wu: Section-Aware Commonsense Knowledge-Grounded Dialogue Generation with Pre-trained Language Model, COLING 2022.

S14.【CCF-B类顶级自然语言会议,长文 Findings,主要参与人】 Dawei Zhang, Sixing Wu, Yao Guo and Xiangqun Chen: MOBA-E2C: Generating MOBA Game Commentaries via Capturing Highlight Events from the Meta-Data, EMNLP 2022.

S13.【CCF-A类顶级自然语言会议,长文 Findings,一作】 Sixing Wu, Ying Li,  Dawei Zhang, Zhonghai Wu: KSAM: Infusing Multi-Source Knowledge into Dialogue Generation via Knowledge Source Aware Multi-Head Decoding, ACL 2022.

S12.【CCF-B类顶级数据挖掘会议,长文,一作】Sixing Wu, Minghui Wang, Ying Li, Dawei Zhang, Zhonghai Wu: Improving the Applicability of Knowledge-Enhanced Dialogue Generation Systems by Using Heterogeneous Knowledge from Multiple Sources, WSDM 2022.

S11.【CCF-B类顶级自然语言会议,长文,一作】 Sixing Wu, Ying Li, Minghui Wang, Dawei Zhang, Yang Zhou, Zhonghai Wu: More is Better: Enhancing Open-Domain Dialogue Generation via Multi-Source Heterogeneous Knowledge, EMNLP 2021.

S10.【CCF-A类顶级语音交互会议,长文,一作】Sixing Wu , Dawei Zhang, Ying Li, Zhonghai Wu: Multi-Path Training Framework for Data-Driven Open-Domain Conversation System,ICASSP 2021.

S9.【CCF-A类顶级人工智能会议,长文,一作】Sixing Wu , Minghui Wang, Dawei Zhang, Yang Zhou, Ying Li, Zhonghai Wu: Knowledge-Aware Dialogue Generation via Hierarchical Infobox Accessing and Infobox-Dialogue Interaction Graph Network, IJCAI 2021.

S8.【CCF-B类顶级自然语言会议,长文 Findings,一作】 Sixing WuYing Li, Dawei Zhang, Zhonghai Wu:

Improving Knowledge-Aware Dialogue Response Generation by Using Human-Written Prototype Dialogues, EMNLP 2020.

S7.【CCF-A类顶级人工智能会议,长文,一作】 Sixing Wu, Ying Li, Dawei Zhang, Yang Zhou, Zhonghai Wu: TopicKA: Generating Commonsense Knowledge-Aware Dialogue Responses Towards the Recommended Topic Fact. IJCAI 2020.

S6.【CCF-A类顶级自然语言会议,长文,一作】 Sixing Wu, Ying Li, Dawei Zhang, Yang Zhou, Zhonghai Wu: Diverse and Informative Dialogue Generation with Context-Specific Commonsense Knowledge Awareness, IJCAI 2020.

S5.【CCF-B类自然语言会议,长文,一作】 Sixing Wu, Dawei Zhang, Ying Li, Xing Xie, Zhonghai Wu: HL-EncDec: A Hybrid-Level Encoder-Decoder for Neural Response Generation, COLING 2018.

S4.【CCF-C类会议,短文,一作】 Sixing Wu, Ying Li, Xinyuan Zhang, Zhonghai Wu: DLCEncDec : A Fully Character-Level Encoder-Decoder Model for Neural Responding Conversation. COMPSAC 2018.

S3.【CCF-C类会议,长文,一作】 Sixing Wu, Ying Li, Zhonghai Wu: Low Frequency Words Compression in Neural Conversation System. ICONIP 2017.

S2.【发明专利,已授权,实际完成人、一作导师】李影, 巫思杏, 岳阳, 吴中海:  基于可疑行为识别的通讯诈骗实时检测方法和系统. 发明专利 已授权 2017

S1.【EI期刊,完成核心算法和所有实验】Nan Pan, Yi Liu, Sixing Wu: Adaptive Matching Algorithm for Laser Detection Signals of Linear Cutting Tool Marks. IET Signal Process, 2017

 

作为合作者参与的成果:

C6.【CCF-B类顶级自然语言会议,长文】 Zeru Zhang, Zijie Zhang, Yang Zhou, Lingfei Wu, Sixing Wu, Xiaoying Han, Dejing Dou, Tianshi Che and Da Yan: Adversarial Attack against Cross-lingual Knowledge Graph Alignment, EMNLP 2021.

C5.【CCF-A类顶级数据挖掘会议,长文】 Yang Zhou, Zeru Zhang, Sixing Wu, Victor Sheng, Xiaoying Han, Zijie Zhang and Ruoming Jin:Robust Network Alignment via Attack Signal Scaling and Adversarial Perturbation Elimination, WWW 2021.

C4.【已公开】Gong Zhang, Yang Zhou,Sixing Wu, Zeru Zhang, Dejing Dou: Cross-lingual Entity Alignment with Adversarial Kernel Embedding and Adversarial Knowledge Translation. CoRR abs/2104.07837, 2021

C3.【CCF-A类顶级机器学习会议,长文】 Jiaxiang Ren, Zijie Zhang, Jiayin Jin, Xin Zhao, Sixing Wu, Yelong Shen, Tianshi Che, Ruoming Jin, Dejing Dou: Integrated Defense for Resilient Graph Matching, ICML 2021.

C2.【CCF-C类会议,长文】 Yang Zhou, Jiaxiang Ren, Sixing Wu, Dejing Dou, Ruoming Jin, Zijie Zhang, Pengwei Wang: Semi-supervised Classification-based Local Vertex Ranking via Dual Generative Adversarial Nets. Big Data 2019.

C1.【CCF-B类顶级数据挖掘会议,短文】 Yang Zhou, Sixing Wu, Chao Jiang, Zijie Zhang, Dejing Dou, Ruoming Jin, Pengwei Wang:, Density-Adaptive Local Edge Representation Learning with Generative Adversarial Network Multi-label Edge Classification,ICDM 2018.

 

学术活动

截止2023年2月底,担任EMNLP 2022、ACL/ARR2021-2023、AAAI 2021-2023、NLPCC 2021-2022的等国内外顶级会议的审稿人PC Member or Reviewer)以及IJCAI 2022紧急审稿人

 

科研项目

P5. 预训练语言模型视角下的开放域对话与常识知识的高效匹配融合,必赢电子游戏网站,云南省教育厅2023年度科学研究基金项目,主持,进行中,2023-2024.

P4. 知识融合的开放域对话生成,必赢电子游戏网站,必赢电子游戏网站人才引进-青年培优计划项目,主持,进行中,2022-2025.

P3. 已隐藏

P2. 北京大学-工银科技智能推荐系统1期研究项目,校企合作项目,主要参与人,已结项,2020-2021.

P1. 基于非结构化数据的智慧城市知识建模与模型自增长自演化技术,国家重点研发计划项目下子课题, 北京大学,主要参与人,已结项,2017-2020.

 

课程信息

本科生课程《Python程序设计实践》:2022-2023学年春季学期

研究生课程《论文写作指导》:2022-2023学年春季学期

 

员工指导信息

2022-2025 硕士生:俞煚、赖浩森、王烁欣

2021-2024 硕士生:李钒效(合作指导)

 

2021-2025 本科生:软件工程专业 4人,人工智能专业 2人

 

2019-2023 毕设指导本科生:软件工程专业 5人,软件工程专业职工 2人

关闭