- 大家好,我是FinTech社区创始人Lucy。 FinTech社区主要从事金融科技/量化投资/区块链招聘的社区
- 目前我们与电鸭合作,有大量区块链相关职位的招聘,有兴趣的可以关注我们的招聘帖子:https://eleduck.com/posts/pqfJRb
有招聘需求的企业也能够通过邮箱 dianya@fintechgl.com 联系我们哟!
2020的全球经济都处在波澜诡谲的动态中,一方面,“最难求职季”频频出现在大众的事业中,很多人为了保住饭碗努力挣扎;另一方面,有互联网“大佬”年纪轻轻财富自由让人艳羡,有量化从业者的优渥待遇令人趋之若鹜。
是什么决定了行业与行业,人与人的不同境遇呢?
努力必不可少,但技术路线,知识储备的选择更占了巨大的比重,我们可以发现,在可以穿越“牛熊”的科技金融行业,掌握“核心科技”是必不可少的职场特征。
而谈到近几年最为火热的技术,就不得不提深度学习!
本期文章不会重复探讨深度学习技术,而是直接回答大家在面试中有关深度学习最关心的问题,一定助大家一臂之力!
1. 深度学习算法在互联网/金融科技/量化自营 等行业公司的应用场景有哪些?
2. 顶尖公司如何考察深度学习?
3. 如何在Top公司对于深度学习知识考察中脱颖而出?
看完这篇文章,你将收获:
1.了解TOP 互联网/金融科技/量化自营 公司真正care的深度学习技术
2.熟悉TOP 公司如何考察候选人的深度学习背景
3.学习第一手面经资料
4.打包极具价值的深度学习面经大全
1 深度学习应用场景
过去的10年中,伴随诸如大数据分析,遗传算法,机器学习等技术的发展,互联网和金融服务业发生了革命性的变化。
现在,互联网和金融科技(FinTech)都正处于将人工智能和深度学习融入生产的真正革命性时刻。
这种结合发生在各方面,正在以过去的我们无法想象的方式来重塑生态。在互联网公司,深度学习对于推荐系统不断推动,并扩展到生活中各方面的智能化。
在金融相关行业, 人工智能深度学习和金融的结合, 从使用场景最为直接的风控与零售银行业务开始突破, 扩展到券商的智能投顾, 以及投行与券商自营部门的量化交易等。
总体来看, 整个行业的技术与创新发展仍处于早期阶段,对于人才的需求十分旺盛。
1.1 互联网公司(Google,BAT,TMD...)
-
推荐模型
-
图像识别
-
语音识别
-
智能安全
-
流程智能化(RPA)
...
互联网公司对于深度学习技术的使用深入而全面。
尤其对于搜索引擎和电商来说,推荐系统都是重中之重。深度学习模型已经被广泛应用在各种推荐系统之中,图像与语音更是深度学习的成名之地。
另外在科技公司中,智能安全被用来大大提升安全系统性能,流程智能化则能提高效率,节省人力。
1.2 广义金融科技公司(蚂蚁科技,京东数科,领创智信,微众银行...)
-
零售数据分析,可信精确营销
-
智能消费推荐
-
智能信贷模型
-
智能风控系统
-
智能资管系统
-
客服, 投研, 投顾机器人
-
联邦数据学习
由于新技术带来的巨大想象力,金融科技对于深度学习技术情有独钟,以上的具体场景可以被大概划分为:
-
自动化: 包括了流程自动话, 语义语音识别等
-
分析及决策: 数据挖掘, 市场趋势分析, 趋势预测
-
新业务: 智能投研, 智能投顾, AI Trading等
1.3 量化交易公司
-
时间序列预测
-
舆情因子预测
-
流程智能化
...
深度学习通过分层结构之间的传递数据学习特征, 被证明对各类金融数据具有良好的适用性。
目前的RNN,LSTM, CNN, 等算法在股票市场预测, 风险评估和预警等都有丰富的相关应用,在量化交易公司中,已经被广泛应用与开发更高质量的量化模型。
2 TOP公司如何考察深度学习
对于大多数公司来说,深度学习都是一个较新的领域,同时深度学习人才紧缺,薪酬高昂,因此公司对于人才的考察都会有较高的标准。
近两年这样的情况尤其明显,不仅需要过硬的简历,扎实的基础,还需要对于深度学习技术有实践经验,真正能够对于公司在应用深度学习改进各项业务方面有帮助。
模型评估方法
-
Accuracy作为指标有哪些局限性?
-
ROC曲线和PR曲线各是什么?
-
编程实现AUC的计算,并指出复杂度?
-
AUC指标有什么特点?放缩结果对AUC是否有影响?
-
余弦距离与欧式距离有什么特点?
基本方法
-
如何划分训练集?如何选取验证集?
-
什么是偏差,方差,过拟合?深度学习解决过拟合的方法有哪些?
-
解决欠拟合的方法有哪些?
-
深度模型参数调整的一般方法论?
优化方法
-
简述了解的优化器,发展综述?
-
常用的损失函数有哪些?分别适用于什么场景?
-
梯度下降与拟牛顿法的异同?
-
L1和L2正则分别有什么特点?为何L1稀疏?
深度学习基础
-
以一层隐层的神经网络,relu激活,MSE作为损失函数推导反向传播
-
NN的权重参数能否初始化为0?
-
什么是梯度消失和梯度爆炸?
-
常用的激活函数,导数?
-
relu的有优点?又有什么局限性?他们的系列改进方法是啥?
-
sigmoid和tanh为什么会导致梯度消失?
-
一个隐层需要多少节点能实现包含n元输入的任意布尔函数?
-
多个隐层实现包含n元输入的任意布尔函数,需要多少节点和网络层?
-
dropout和BN 在前向传播和方向传播阶段的区别?
CNN
-
给定卷积核的尺寸,特征图大小计算方法?
-
网络容量计算方法
-
共享参数有什么优点
-
常用的池化操作有哪些?有什么特点?
-
CNN如何用于文本分类?
-
resnet提出的背景和核心理论是?
-
空洞卷积是什么?有什么应用场景?
RNN
-
简述RNN,LSTM,GRU的区别和联系
-
RNN的梯度消失问题?如何解决?
-
lstm各个门分别使用什么激活函数?
-
简述seq2seq模型?
-
seq2seq在解码时候有哪些方法?
-
Attention机制是什么?
2.2 实践项目经历
实操能力是公司最为看重的能力之一,仅仅掌握丰富的深度学习相关理论知识在工作中是远远不够的。
这也是很多候选人发现在经过了一段时间的学习后,发现自己明明基本上知识点都已经掌握了,在面试中也能够比较好的回答面试官的各种深度学习常规问题,但是却往往不能得到offer的重要原因。
**向面试官讲解实践项目经历的过程,就是展示自己实践能力,解决问题能力的绝好机会。**这里建议大家关注项目的三个点,业务,数据,模型。
业务:业务是一切的目标,首先要明确业务中要解决的问题是什么,业务目标是召回还是预测的准确率?所使用的的标签怎么定义的,分析过程是什么?
数据:数据是深度学习的灵魂,能否合理使用数据,是模型任务是否成功的关键,可以说数据不好,一切算法都无能为力。数据定义,数据渠道,数据质量,特征工程等,具体如样本量多少?怎么采样的,是否考虑时间对样本的影响?获取特征的时间段是什么?如果一些数据都来自比较早的时间,对模型建模是否有影响,怎么解决这种影响如何做的特征筛选?如何根据现有数据进行对应特征工程,从而提升性能,节约成本。
模型:模型应该根据业务需求和数据情况进行选择,并不是越复杂的深度学习模型就一定能有越好的性能,在面试中一定要注意不要炫技,解决问题是唯一目的!
2.3 数据处理能力和业务思考
**在实践中,业务特征和对应的数据是决定深度学习技术能否有效应用的关键!**再怎么强调都不为过,也是非常能够体现个人技术实践水平和思考方式的领域。
如果能够通过积累深入了解,并总结出一套有效的经验,那么我们相信也一定能够打动面试官,在一群优秀的候选人中脱颖而出。
这里建议大家可以根据第一节中的应用场景对业务进行了解归纳,结合自己的项目经历,重新思考,强调对业务的贡献**。**
面试中数据处理能力也是被考察的重点。
实际业务中的数据远远不像学术界,或是各项比赛中那么理想,复杂费时的预处理是进行解决业务问题时不可避免的环节,如果大家可以对处理数据和如何根据数据创造解决方案这方面有丰富的经验,可以说公司一定会对你大声说yes!
3 深度学习面经
本节中,我们将详细描述独家渠道获得的不同类型公司2019-2020年深度学习相关面经,大家可以从中一窥行业前沿,并根据自身情况,吸收归纳。
注意本章节不考虑计算机基础,编程基础部分,此部分目前一线大厂岗位要求候选人达到 Leetcode medium 及以上难度200题 并且熟悉数据结构+计算机网络基础+操作系统基础**。**
3.1 独家面经--互联网与金融科技
职位: 某著名一线生活服务互联网公司 数据科学岗
-
介绍自己--常规问题
-
描述个人机器学习/深度学习有关项目背景,需要覆盖:目标,调研情况,如何选择模型,背后驱动因素,当时改进的路线,改进方式,最后交付的模型效果、业务收益,后续还存在的优化点,迁移的场景
-
过拟合的原因及解决办法
-
能解释一下梯度消失或者梯度爆炸的原因,以及如何解决吗?可以数学角度解释吗?
-
能介绍一下常用的神经网络模型吗?
-
了解LSTM吗?门的概念了解吗,三个门分别是什么,有什么作用?请问LSTM主要解决什么问题?
-
请介绍一下你常用的 Loss 函数,详细说说区别和使用场景,原理推导
职位:某一线互联网大厂金融科技 算法岗
-
介绍自己
-
深度学习基础:CNN,RNN 树模型,XGBoost,LGBT 损失函数推导,模型比较。
-
如何衡量模型的参数和大小
-
对最新的深度学习趋势有什么了解
-
对深度学习技术目前在金融科技领域的应用有什么了解,可以举例子说明吗
-
如果需要设计一个信用卡在线交易欺诈检测模型,请从数据和模型角度说说你的看法。(由简入深)
-
聊聊最近看的论文
职位:某北美金融科技大厂 Research scientist(ML/DL)
-
介绍自己
有过机器学习/深度学习应用经验吗,挑其中最感兴趣,最让你有成就感的项目详细说一说,
-
为什么选择这样的深度学习技术?现在再给你一个改进的机会,你会如何提升项目效果?
-
现实业务场景中,对于深度学习模型,数据方面的特点你觉得是什么?如何通过对数据的处理来提高解决问题的效率?如何将高维的变量映射到低维?
-
说一说自己了解的深度学习在金融科技方面的应用场景,并评价其潜力
-
最近看的印象深刻的论文
3.2 独家面经--高频自营
方式:应用机器学习/深度学习方法,根据提供的数据集,完成一个市场信号涨跌预测模型,需要根据自身思考,自行丰富内容。提交模型,代码,文档,现场答辩。
时间:72小时
数据内容:包括数天的数据
模型拟合预测目标:1s,5s,10s内某一信号的涨跌情况。
72小时完成模型后,撰写报告和PPT,和不同背景面试官进行交流。
着重关注面试者如何将深度学习技术灵活应用在提供的场景中,如何对数据进行有针对性的有效的改进。
4 总结
以上就是本期给大家带来的深度学习面经,我们总结了在互联网与金融科技行业内的种种应用场景,根据广泛的信息收集总结了面试中被考察的重点与回答技巧,同时也为大家带来了近年的面经真题。
希望大家能够明确目标,查漏补缺,一起在寒冬中点燃深度学习技术的火把,走向光明的下一站!