OR是关于decision making的一个学科。包括management science,industrial engineering,operation management这些相关的学科都是与decision making相关。
课程:
运筹的两个基石等级的课程:Stochastics(随机、概率)和Optimization(优化)。运筹最开始大概是从二战期间发展起来的,xx曼来搞随机和优化的问题。
Stochastics或者叫Applied Probability和Optimization一直是OR科研和教学的主要方向。因为它提供了两个有利的工具。Stochastics刻画了系统的随机性,起到了建模的作用。我们拿到任何一个问题,可以用OR的思想,先刻画系统的随机性,所以从这个角度来看,随机和概率就比较重要。
回到OR的最根本的定义,他是关于decision making的学科。所以Optimization帮我们解决了一个问题,我们怎样去寻找最优的一个方案,或者说最优的一个决策。他其实是找一个系统的最优点,一方面是利润最大,一方面是cost最小的一个工具。
另外Stochastics(随机、概率)和Optimization(优化)这两个基石会建立在很多的应用的问题之上,稍后会来细说这些应用的方向和问题。
无论是美国,欧洲还是在国内,OR和MS(管理科学)有很多类似的学科,比如Industrial Engineering和Operation Management(OM)。
首先先来讲OR和OM的区别。OR更加侧重数学工具的发展,比如随机和优化的一些理论、一些算法,他会做数学和算法性的东西。OM更关注应用,比如说定价、供应链这些应用的问题。IE更像是Engineering School的版本,OR和OM的engineering版本。
无论在美国和国内的一些学校都会有。它的思维方式更加偏向Engineer,他不那么追求数学上的美感,而是追求比较有利的应用。MS也是一个比较模糊的称呼,至于为什么PPT中有OR和MS,是因为这里有一个学术协会叫做Informs,全称是institute of operations research and management science。大家做IE和OM的都会加入到这个学术组织。
与其他学科的区分:导师原来是学统计的,是在读博士第三、四年的时候才意识到这些区别。
统计和数据科学
更关注的是给我们要分析的数据去建立一个模型,去估计这个模型的参数。比如估计一个灯泡的使用寿命,建立了一个 XXXmentional distribution?来刻画灯泡的使用寿命:观测100个灯泡,估计灯泡的使用寿命。
它所关注的是我们这个模型的参数,比如XXXmentional distribution?这个λ。假设这些灯泡的寿命真的服从一个XXXmentional distribution?,那我们通过有限的样本究竟能估计多准。
统计和数据科学更多的是看重对模型参数的估计问题,包括economics同样是关注参数的估计问题,比如研究一些新的政策,需要做回归分析,会看一些参数的正负,来有一些对这个问题的理解,它关注的是我们通过建立一个模型,然后对数据进行解读,然后我们对模型、参数的估计和理解,这是统计和数据科学,包括经济学关注的一些问题。
ML和AI
这两个领域基本都是CS的人在做,关注的更多的是Prediction accuracy。一个预测问题,但是它不在乎建立一个模型开看参数怎么样,但是模型参数估计和预测的精度这两个之间有一定的联系,但是从ML,AI的角度来看大家不是那么关注参数是不是能估计准,是关注预测时候的准确率。
比如估计一个事情,做下图片分类,不关注给图片建立一个概率分布参数,而是关注比如给一个训练好的模型,输入一些图片,然后它是不是能够识别出来。然后还有比如NLP的问题,它翻译的是不是准确;他们都会把问题转化成一些类似于准确度的指标。ML这个学科就变成了发展不同方法和理论,去提升预测的准确度问题的一个学科。
而OR则是关于在决策的问题。统计和ML,在处理一个问题的时候跟根据特殊的数据来建模,但是OR会关注整个系统。还是以灯泡寿命为例,在估计了参数之后,通过这个参数,给实际的决策,比如生产的决策,买不买灯泡的这个决策,带来了什么启示。
OR最后的落脚点永远是在决策上。所以在建模这里的视角会更加的宏观,最终关注的objective是人在做的一些决策。之后会分析什么是决策,什么是预测。
回到OR的两个基石(随机和优化),导师理解的70-80%的OR,无论是业界还是学术界的模型,都会分成两步:Stochastic Modeling和Decision optimization。第一步是通过Stochastic Modeling工具把系统建模,把系统的随机性刻画出来,然后基于这样的随机模型,把一个比如说利润、或者损失表示成一个expected的function?;然后用第二个工具optimization,来找到最优的一个决策。
所有从OR的两个基石:随机和优化,到整个学科的思维方式是一个串联的关系。OR的人第一个出发点永远是看系统的随机性是什么,把随机性刻画好了,用随机刻画好了,把目标表示成一个随机变量的expectation,然后去找这个模型里面找可以操控的decision,去改变这些变量,来达到利润的最大化,cost最小化的目标;所以两步是 第一步刻画系统的随机性,第二步是 通过优化问题把最优的决策找到。
为什么OR在国内被淡化。可能是因为大家没有意识到什么是operations。其实在它是在商业和工业环境中的一种决策的思路和方法。举几个例子,只能用OR可以解决,其他如统计和ML解决不了。
supply chain和logistics。是OR非常传统的一个应用。发展的开始时在二战中美国怎样给军队做战备的补给。现在比较火的主要是大型的在线电商和大型的零售商的库存管理。比如国内阿里的菜鸟物流系统,全国一共130个仓库,分布在30个城市,在管理着上万种商品(8000种)。那这8000种商品是存放在每一个仓库还是每一个商品只存放在一个仓库。
这就是一个很典型的operations的问题,因为它是人为的一个需要做的决策。不是ML可以预测出来的问题。本身就不是一个预测问题,而是在系统最开始需要设置的一个问题。比如把8000种商品每一个仓库都存的话,问题是一个仓库放不了这么多商品,而且每一个仓库放的太多的话,它分解的效率也会变低;反过来,如果每一个商品只放在1个仓库,outdoor shipping-外部的运输这里,比如把所有的方面便都放在上海的一个仓库,那它的发货会有很大的问题。
所以从最早的建立仓库,做库存的部署的时候,这就是一个很经典的OR问题。这个问题在目前的学术界和业界都没有做好,没有一个大家都觉得好的一个解决方案。
对比京东的库存管理,与菜鸟不同,是分级的物流系统,有严格的仓库之间的隶属关系。有地区级的仓库,有前端仓库。地区级的仓库比如北京和上海有非常大的仓库,然后附近的小城市都有自己的仓库;每次都是由大仓库往小仓库,每天早晨做发货的决策。比如每个大仓库往每个小仓库,某种商品,每天发货发多少,然后一共几千上万种商品。
这些都是需要做的决策,这里需要注意的是,这些决策都是我们人为需要做的decision,通过做decision来最大程度降低每个地区的花费,保证每个地区的人都能最快的拿到货,也保证各地的库存不是加的很明显。这个东西不是建个模型可以估计出来的或者预测出来的,这是我们的决策。只要是关于决策的,就都是OR需要考虑的问题。
Pricing和Revenue management。定价,比如国内外的一个大型电商的网上商品价格一直在变。从公司的角度来说,定价就是一个decision。价格不是可以预测的,而是商家、零售商来同一管理。而设定价格的目标就是能最大化自己的利润。
什么样的价格最合理,多长时间改价格合适,促销是定价多少合适~目前的学术界和业界对促销定价的研究和实践都很粗糙,只是大家看着差不多合适,8折或者5折,但是折扣的力度和频率都没有做过系统性的优化。包括滴滴和Uber的定价,每个时刻给每个顾客设什么价格:价格太高,顾客少了;价格太低,又赚不到钱。所以需要设定一个优化到系统利润的平衡点。
还有一种会面临的决策,比如滴滴的一位司机,系统匹配到一个订单,到2km外接一位客户,开到2km外需要5分钟,但是司机在开到2分钟的时候,系统发现,距离车很近的一个位置有另外一个客户,那么是应该放弃2km之外的第一个客户转而接附近的客户,还是继续去接第一个客户,然后在安排另外一个司机来接,这些都是决策。包括阿法狗的围棋的子下在什么地方,其实是决策的问题,不是预测。
所以阿法狗背后的模型最早也是OR的人基于随机过程?和ML在做。包括自动驾驶的方向盘、刹车都是决策,不是预测车会往哪里开,而是车往哪里开最安全,最快速,然后决策什么时候转方向盘,什么时候踩刹车,什么时候踩油门。
Q:学生提问:总觉得决策还是基于最优化?
A:一般来说在试图找到最优决策永远是优化的过程,但是运筹学和decision making又不止于优化,因为他们涉及到建模的部分,我们怎么样描述系统的随机性,我们怎么样把系统的利润和损失找到一个数学表达,然后这个数学的表达又是数学上比较好优化的东西,整个一个系统性的建模过程都是需要OR的经验。
Service system
一个经典的应用举例:电话服务中心(现在基本已经自动化了);怎么来排班,让大家快速接到电话,不需要太多人来排班。包括医院的排班系统,都是OR的案例。比如医院如果要太多的护士和大夫,它的成本会很高;如果少的话,病人等待时间又会变长。
Q学生提问:但是这些决策不是都需要预测或者估计提供一些结果吗?比如Uber刚刚那个问题,是不是可以预测一下会不会司机开到一半出现一个正好在路边的乘客
A:Uber司机走到一半路边刚好有一个乘客,这个事情是不好预测的,或者说没法预测的。可以预测的是北京某个区或者某几个阶段在今天5点左右会有多少需求,然后可以提前1小时左右往这个方向大量派车-这个事情可以做-一个地区或者一个时段内有多少需求可以做。比如今天晚上这里有个演唱会,那Uber就可以提前给司机发个通知,或者给奖励让司机都去这里接人
。但是在接应过程中,突然一个乘客在身边,这个事情是很容易发生的,但是是无法预测的,因为它是一个个体。可以预测的是整体。回到电商的例子,无法预测的是某个街道,明天有多少人去买方便面,但是可以预测的是这个城市明天有多少人去买方便面,所以可以做这个城市整体发货的一个决策,但是到街道,即使可以预测,它的误差也会非常大。这类事情在建模的过程中会把它作为随机项来看待。
Scheduling and manufacturing design
现在中国还是一个工业化的大国,所以机遇还有会很多。据导师的了解,国内很多公司的工业生产并没有做一个流程化的优化。各种零部件的库存的准备和生产线的优化,都还有很大的空间。
导师了解到的OR的硕博去向的比较大的两个方向是IT和OR。然后是OR-related,比如在线电商做库存的,还有一些零售商的公司,或者航空公司设计调度的决策。
之所以IT和Finance放在首位是因为OR或者统计这些学科其实是教给你一种思维方式和方法论。OR具体并没有特别对口的一个方向,包括互联网公司,金融公司,它们需求的并不是某一类的特殊人才,业界所面临的问题都是非常复杂的问题,他们需要一个团队的人来做,团队中有做OR的,CS的,ML的,统计的等等,大家共同的来解决这个问题。
IT和Finance目前的市场还比较好,从读书的角度来说,并不需要去纠结,假设想去IT,那到底应该读OR还是统计。导师认为这些IT和Finance公司从招聘的角度来说,并不会特别看重究竟是出身是OR,统计还是CS,更看重的是你能不能学到本专业的思维方式,能不能用本专业的技能来解决一些问题。
因为这些公司,OR,统计,CS包括econ各方面的人才他们都需要,导师对大家的建议是,在选择未来学习、科研方向的时候一定要选择自己感兴趣的。或者说自己能申请到的最好的学校的专业。因为学校名气如果比较好的话,公司的招聘会会比较多,自己的机会会比较多。读博士也是,科研的话,好的学校老师也会更强,来开讲座的人也会更多,自己听到信息也会更多。从这个角度来说,如果学生自己在纠结自己到底申请OR还是统计还是CS的话,这个时候来想,自己在哪个方向可以申请到的学校更好~
导师认为综排top20的学校都还不错,各个方向都不会太差。方向这里即使是master OR的项目,课程中也会加一些ML的课程,因为从开硕士课程的角度,也是希望把学生培养成为能找到一个好的工作,所以也会设置一些业界所期待大家需要掌握的技能。所以这些项目有一种同质化的趋势,培养方案和模式都差不多。
Startups:导师个人很看重OR方向的人出现一些startups,因为作为工业大国的中国,所以工业中有很多可以优化,可以改进的东西。目前社会对决策优化的意识程度还不高,所以这里面会有很多的机遇。
Q:Startups主要包括哪些内容老师可以再说一下吗?
A:可以搜索interpret management?的Startups,hopkins的Startups,去看他们的成绩会有很多的灵感,比如supply chain management的Startups,会看到很多非常新颖的灵感,他们不管用OR,也会用ML的一些技术。比如做超市的库存管理,比如生鲜品因为很容易坏了,那应该怎么进货?进货少了,顾客就直接卖光了,需求没有被满足,但是如果进货过多,东西就坏了,所以怎么做这种决策。关于编程的问题,现在这个时代,无论是OR,统计,还是计算机对编程都有要求,我们至少要掌握R, Python,尤其是自己不是编程出身,对C++,JAVA这些不熟的话,这些都是对自己未来的发展非常必要的。
硕士项目
项目长度最好选择2年的项目,因为1年的项目会比较仓促,因为毕业之后就要找工作,意味着来了之后就要准备来年找工作的事情了。
学校的名气决定了它会有多少公司来招聘,它的校友资源人脉怎么样,能不能拿到内推,内推会不会被重视。Placement是说这个项目之前的学生的就业出路都怎么样。
博士项目
要考虑商学院还是工学院的问题。因为商学院更偏应用一些,工学院更偏数学,更偏engineer。
所以要看自己的背景,是更喜欢讲故事,做一点序?的事情就去商学院;如果更喜欢数学,engineer就来工学院。
学术界还是工业界
对于博士来说,比较灵活,可以自由的切换。一般来说OR指的是工学院,OM指的是商学院。OR更多是研究算法、数学的事情—比如提出更好收敛性的,更快的,更低复杂度的算法,概率和优化的教学和科研;OM有商学院案例分析的风格,更多的是比如给一个公司做一个具体的定价方案—商学院风格的科研。OR和OM在业界都差不多,只说在在学术培养和教学科研这里有些不同。
硕士:
一般的项目一年收上千份申请,所以PS不会特别重要,因为老师没时间看PS,主要是GPA设置一个线,线下的就不看了;
实力经历/科研经历,与推荐信联系在一起;推荐信也是可以量化的,在推荐人提交时,会有打分系统,比如学生在导师这里排名是5%,10%还是50%,这是个量化的东西。如果导师打分是50%就比较悲剧了。
博士:
GPA第一位,反应对知识的掌握。科研经历和推荐信是非常重要的。大家容易忽视的是GRE math sub。GRE分数(包括TOEFL)对博士来说没那么重要,过线就行。导师在自己学校听教授提到过,GRE math如果能拿到99% 98%的(至少在95%以上),可以很好地反映出自己的数学能力。
虽然GRE math sub不是学校的强制要求,但是导师认为sub还是一个非常重要的参考,尤其是自己数学成绩不好的情况下,工学院对sub看中的程度要比商学院更高的。但是商学院的PhD申请非常难,因为招的人少,每年只有2-5个人左右。
对于PhD来说,PS就很重要了,虽然申请的学生也很多,但是会缩到一个短名单,最后缩到20-30个人,从这之中挑10个左右,这个过程会非常仔细的读学生的PS的。
Q学生提问:工学院对数学课程的要求?
A:因为导师后面也会自己找教职,从招生的角度,导师认为学生至少有数学分析,高等代数,概率论;作为导师自己也期待学生有测度论?、时间函数都要学。然后优化,随机过程,包括统计的一些课:统计推断,多元统计分析,ML的一些课。
Q学生提问:工学院PHD会不会要求GRE Quant一定170或者至少169?
A:GRE Quant 没那么重要,考167问题也不大,只要数学成绩足够好就可以。因为招生时,尤其是PhD申请,大家写的材料,导师一看就能看出来学生的材料是不是经过中介修改过,会知道学生的水平;导师不会通过GRE Quant看学生的数学水平,而是通过上过的课程和PS和科研的经历就大概知道了学生的数学水平。
数学课程对于OR PhD来说非常重要,建议多修一点。导师也建议大家在PhD前两年不要做太多的科研项目,建议把时间花在多学一点课(不一定是只学数学),多些知识积累。
Q:学生提问:phd工学院选校有什么建议么
A:工学院选校分档:
一档
MIT-ORC
Stanford-MS&E
Princeton-ORFE
二档
UCB-IEOR
Columbia-IEOR
Cornell-IEOR
Northwestern University-IEMS
佐治亚理工稍弱,gatech的排名高是因为系里的老师比较多,但是科研能力略逊;然后是密歇根大学工学院;USC工学院,wisc,ncsu,unc,明尼苏达,uw和弗吉尼亚理工的工学院;可以搜索informs(institute of operations research and management)的网站,有工学院排名的名单。
另外选校可以看自己学校的师兄师姐们都去了什么学校作为参考。
Q学生提问:对于港校和北美学校的选择有什么建议么
A:香港是不错的选择,因为这些年有些北美比较强的老师被挖过去,科研能力在不断的提升;包括英国和欧洲的OR项目;也可以参考一些微信公众号,比如【运筹帷幄】(我查了,但是不太对~~)但是香港PhD毕业之后如果想去美国做博士后就会比较难~香港在学术水平上,可以接近美国30-40排名的学校
Q学生提问:如果申请商学院项目,理论学习方面会不像工学院一样重视吗
A:商学院也有做的非常理论的项目,比如MIT,芝加哥bootsh,哥伦比亚DRO(Decision, Risk, and Operations),USC Marshall 下设DSO项目,杜克的decision science项目,这几个PhD都是比较重视理论的。但是商学院一般来说对理论的重视要比工学院差一些。
Q学生提问:program是不是重视理论怎么去看呢?
A:看导师发的paper。Paper里面有多少数学。paper里面都是图表,做回归就是不重视理论;如果全是证明,就是重视理论。
Q学生提问:这个领域发paper的难度怎么样 周期怎么样
A:发paper难度比较高。OR两个top journal的从头到发表平均在2年半左右,导师见过的最长的一篇是10年在投,16年才发表;MS比较快,平均在1年半左右;第三位的是MSOM (Manufacturing & Service Operations Management),第四是POMS (production and operations management society),审稿周期在9个月到1年。整体来看,这个领域发paper要比ML和AI要难。
Q学生提问:排队论是OR还是OM呀?
A:排队论属于OR。排队论属于applied probability,集中在工学院。OM用排队论一般用作应用的问题,只是用这个随机模型,但不会很深入的研究技术。
Q学生提问:phd如果之后想走工业 需要侧重哪些技能
A:数据处理能力,编程能力—---技术的全面性(CTO的角色,从头做到尾);学术的话就是某一个或者几个领域有专长。