在这个信息爆炸的时代,每一天都有不计其数的网络舆情产生。而随着计算机硬件性能的快速提升和机器学习算法的迭代升级,网络舆情的实际应用不再遥不可及。与此同时,网络舆情时效性强的特点与P2P网贷平台风险预警的内在要求不谋而合。这也在无形之中提升了舆情预警的实际应用价值。
从算法角度考虑,目前常规的舆情预警无外乎于构建正负面词库、收集语料、分词、情感打分四个步骤,算法的应用主要体现在分词的过程中。其中构建词库需要大量的人工成本,而在情感打分的阈值选择上又会掺入过多的主观因素。相较之下,来自于Google科学家们的word2vec,凭借其复杂的算法和高效的应用能力,为我们处理P2P网贷平台舆情提供了全新的思路。
总结
随着余额宝的横空出世,互联网金融的概念逐渐深入人心,在极大地便利和提升投资人的投资渠道与收益的同时,也产生了一些诈骗跑路等恶性事件,使得网络借贷(“P2P”)一时风声鹤唳。但是互联网金融因为借助了金融科技,协助达成了普惠金融这一历史重任,代表了先进生产力的发展方向,正在逐渐证明自己存在的价值。在这一过程中,网贷之家研发的网贷平台风险预警系统,就将结合平台的交易数据、舆情数据、工商信息、专家诊断等多维指标,协助政府、协会、媒体、投资人等提早发现平台的问题,甚至是问题平台,助力网贷行业健康发展。本文就是该系统的舆情分析模块的理论探讨,借助word2vec,通过上下文提取词与词相似性方面效果出众的优势,我们可以极大地提高P2P网贷平台风险预警系统的时效性和有效性。而随着未来深度学习的发展,word2vec还可以在算法上实现更多的优化和提升,特别是在建模的时间成本上将会有明显的改善,这将加快网贷平台风险预警系统的迭代更新,提供更及时更准确的风险预警服务。