1 引言
在《语义相似模型(Doc2Vec)在双语教学中的应用》一文中曾经说过,两年来,我一直想把自然语言处理NLP技术嵌入到双语教学中,现在这个教学框架基本形成。本笔记简要描述了岩石边坡工程双语教学的构想---方法 论以及使用的技术。
2 选用教材
即使是中文教学,选择合适的教材也不是一件容易的事情。在选用教材时,一方面需要考虑教学材料应该满足专业知识的需要,另外一方面需要考虑学生的英文接受程度,语言的词汇和句法尽量通俗易懂。由于国内与国外授课内容有较大差异,因此教材以自编为主,这样做一方面兼顾国情,另一方面兼顾学生的英文接受水平。主要的参考资料有:
[1] Hoek, E. (2007). Practical Rock Engineering. Toronto: Rocscience, e‐book. 341p.
[2] Hoek, E., Kaiser, P.K. and Bawden, W.F. (1995). Support of Underground Excavationsin Hard Rock.
[3] Wyllie, D.C. & Mah, C.W. (2004). Rock Slope Engineering in Civil and MiningEngineering. Taylor and Francis Group, London. 4th Edition. 456 pages.
[4] Wyllie, D.C. (2018) Rock Slope Engineering Civil Applications. Fifth Edition. 621p.
[5] Brady, B.H.G. and Brown, E.T. (2004) Rock mechanics for underground mining, 3rdEdition. 645p.
[6] Dr. Erik Eberhardt为UBC采矿工程专业讲授岩石工程的课件
[7] GeotechSet数据集
3 双语教学的方法 论
有别于传统的双语教学模式,这个改进的双语教学模式把深度学习(Deep Learning)技术嵌入到双语教学中。在这个双语教学设计中,利用了目前最先进的(State-of-the-Art)的深度学习技术来进行主题聚合,文本总结,语义相似和中英互译。通过这种颠覆性的多种形式的双语教学,能够使学生在有趣的教学环境下快速学习中英文专业知识,同时提高学生的逻辑思维能力。
4 语义聚合
在这个双语教学构想中,使用的第一项关键技术是词汇的语义聚合。对任一段文本,抽取和生成与其中关键词汇语义相关的短语,这些短语有的出现在当前的文本中,有的没有出现在当前文本中,无论如何,这些语义相关的词汇事实上已经形成了一个故事,以stability为例,我们生成下面类似的短语,这些短语都与stability紧密相关。这种类似“头脑风暴法"的方法将会极大地刺 激学生学习的积极性和创造性。
analysis_rock_slope / charts /
cliff / dam_foundation /
earthquake_triggered /
effect_rock_bridge / factors_safety /
forces / limit_analysis /
limit_equilibrium_method /
rock_structures / sliding_toppling /
slope_orientation / stable /
surface_mining /
岩石边坡稳定性分析和评价是露天矿运行过程中一个非常重要的阶段。其中岩体结构对边坡稳定性起着确定性作用,因此边坡面的产状应该最大程度地限制岩体的移动,包括平面滑动,楔形破坏,倾倒破坏等。极限平衡方法是实践中最常用的稳定性分析方法,它能快速地计算出边坡的安全系数。在早期的边坡稳定性分析中,为了方便实践的工程师工作,研究者们根据理论分析做出一些标准的图集。随着采矿深度的不断增加,岩桥逐渐对边坡破坏产生着控制作用(岩桥和阶梯式破坏(Rock Bridge and Step-path failure development))。动载荷对边坡稳定的影响巨大,除了上面提及的爆破因素外,地震诱发的边坡也不容忽视。因此在一些容易发生地震的地区,应该考虑地震对边坡的作用。此外,大坝地基的稳定性评价也是边坡工程的一个重要部分(Gravity Dam: 重力式混凝土坝地震力计算)。
目前这个模块集成了三种主要的生成方法:pytextrank, doc2vec和sense2vec. 这三种方法各有千秋,我们将综合使用。
5 文本总结
在这个双语教学构想中,使用的第二项关键技术是文本总结,也就是提取文本的中心思想。在这个教学环节,集成了两种文本总结技术,一种是提取式(extractive)总结【
geotech-PyTextRank-keywords-summarization.py】,即从文本中抽取出最关键的几句话作为文本的中心思想;另一种是抽象式(abstractive)总结,利用目前最先进的文本生成技术,产生出不同于原文句子的总结,这是一项非常具有挑战性和创造性的任务,通过再造段落,一方面使得学生更深刻地理解原文内容,另一方面也学习了与原文不同的表达方式。
6 段落相似
在这个双语教学构想中,使用的第三项关键技术是段落相似。对于我们要学习的内容,从GeotechSet数据集中自动查询与之最相关的内容作为扩展阅读材料。使用C(n,3)的组合算法[geotech-flashtext-passages.py和geotech-flashtext-words-combination.py]对数据集内的段落或单句进行聚合。
7 英汉互译
在这个双语教学构想中,使用的第四项关键技术是英汉互译。对英语不好的学生这是最受益的一项技术,通过使用先进的深度学习技术,能够在课堂上实时对任何中英文段落实现机器翻译而不需要人工处理。[中英文机器翻译模型(Machine Translation)]目前正在训练更多的专业术语,使得翻译质量更加准确和专业。
8 结束语
在这个双语教学构想中,我们也逐步引入问题对答,完形填空,文本生成等更先进的教学模式。总之,通过这个改进的双语课程学习模式,不仅能让学生在有趣的教学环境下学习到边坡工程的专业知识,同时也能够快速提高学生的英文水平和逻辑思维能力,并能在短时间内掌握阅读本课程英文文献的技巧。