2020-05-27 上午10点
自我介绍,然后开始讲我的两个项目:
第一个项目:
问数据集大小,数据来源,如何进行预处理,如何划分训练集和测试集,如何验证未标注的数据!问如何将知识图谱的信息嵌入到预训练模型中,项目有什么不足,哪里需要改进,怎么改进。
第二个项目:
问如何爬取结构化数据,如何定义爬取非结构化数据是我们需要的,并获得需要的实体和关系,如何实现了ner和etl。实体,关系的数据类型的定义,如何进行实体消歧,融合归并。如何设置对话管理模块,包含对话策略,策略优化等。如何设置自然语言理解模块包含意图识别、slot提取、情感分类,写了个cypher查询语句,还问了知识图谱的定义,我讲成了图数据库的优势,然后问我mysql和mongdb还有es的优缺点和分别作用领域。
问用过docker没有,用过git没有
问我平时用什么编程语言,我回答python和c++
然后是一个开放性问题,给了txt的文件,里面是地名,给我一句话,问怎么提取这句话的地名,所有方案。
问了我什么时候可以来,我回答了最快6.1,然后问了我还有什么想问的,我问了这边主要做什么的,他说主要是做机器翻译,还有平时作息早上9-10点,晚上弹性。当天下午就收到我的简历被收入人才库了,也就是凉凉,总结:简历写的有点夸张,把自己给害了。问的好难好细啊!sad!!!
全部评论
(3) 回帖