米國,馬薩諸塞州劍橋市,查爾斯河畔對岸,一片紅磚與灰石相間的建筑群在晨霧中若隱若現。
這就是世界著名的麻省理工學院。
經典的紅磚建筑中,某間辦公室里,一位中年男子正坐在電腦前。
何凱明,計算機領域絕對的大牛!
其提出的ResNet在計算機視覺領域可以說是絕對的基石之作。
哪怕是眾所周知的《Nature》、《Science》這種世界頂級的期刊,其正刊中99%的文章都被ResNet碾壓,因為光光是引用量,ResNet就已經達到了恐怖的十萬加,這無疑是一個非常離譜的數字。
由此其實也能看出在計算機領域,很多傳統的頂尖期刊,比如《Nature》、《Science》、《Cell》,都已經被打入冷宮。
而他的科研成就中,就算去掉ResNet這篇曠世之作,也絲毫不影響他仍然是一個頂級大佬。
雖然他目前是麻省理工學院電氣工程與計算機科學系的副教授,但他仍然是華國國籍,也是此次NeurIPS的高級區域主席,簡稱SAC。
主要工作就是就是負責監督區域主席(AC)還有審稿人的審稿工作,并在他們出現分歧的時候提供自己的見解,
一般來說他很少親自去看這些論文,基本都是掃一眼就分給下面的審稿人進行審稿。
不過,他面前的屏幕上,那篇名為《AgileEdge: Adaptive Co-Optimization for Pervasive Low-Latency Edge AI》的論文讓他提起了幾分興趣。
大約一個小時后,何凱明教授靠在椅背上,長長地呼出一口氣,眼神中帶著一絲贊許,雖然沒有深入閱讀,但在心里,他已經給出了一個不低的評價。
“很有趣的工作,也不知道作者是誰?!被氐絊AC的管理界面,他將這篇論文分給了四個合適的審稿人。
盡管已將論文分配給手下的審稿人,但何凱明還是決定自己也深入看一看這篇論文。
他倒了一杯咖啡,輕輕抿了一口,重新打開論文,開始仔細研讀起來。
不過遠在大洋彼岸的周昀并不知道他的論文此刻怎么樣了,他現在正面臨著一個問題——他快沒錢了。
買了輛公路車,就消耗了他二分之一的存款,再加上這一個月的伙食費又消耗了他三分之一的存款。
現在周昀手里只剩下一千塊了,如果不向家里要的話,這點錢恐怕也就勉強撐到下一發勞務費。
周昀一只手撐著頭,呆呆地盯著電腦屏幕。
“該怎么賺錢呢?”
其實方法還是有不少的,比如去做家教,或者做一些兼職什么的。
但是太麻煩了,他只是缺錢,并不是要餓死了,浪費時間去做這些東西,他還不如找家里要錢呢。
“有什么方法既能搞科研,又能賺錢呢?”這也是最為理想的情況。
就在這時候,旁邊的邱彥傳來一聲慘叫。
“啊!怎么又跌了!?早知道不買這支股了?!鼻駨┮荒樕鸁o可戀的靠在椅子上,手里的手機發出一片綠光。
“誰讓你喜歡買個股的?不像我只買銀行,虧也虧不了多少。”
“別罵了別罵了,再也不碰個股了!”
對面的沈瑞冷笑一聲:“你上次不就這么說的?結果還不是又買了?”
邱彥撇了撇嘴,有些心虛:“那它都跌成這樣了,我不抄底?誰能想到還能跌??!”
“這就是所謂的,別人恐懼我貪婪,別人貪婪我恐懼?你當你是巴菲特呢?”不遠處的俞天睿無情地嘲諷。
面對同門的嘲諷,邱彥無話可說。
“別光說我啊,你今天怎么樣?”
“嘿嘿,這可是你自己問的,我是不想說的,你怎么知道我今天買的股票漲停了?”
說著他揚起手中的手機,紅彤彤的界面,和邱彥手中的綠光形成了鮮明的對比。
“別說了,我有個朋友有點不舒服了?!?/p>
聽著幾個師兄的討論,周昀眼睛一亮。
股票 深度學習模型,這不就是既能賺錢,又能搞科研的方法嗎?
而且現在這種模式已經非常成熟了,就是大家所熟知的量化交易。
量化交易的本質是基于數據和算法,通過建立數學模型來識別市場中的統計學規律,并依據這些規律進行自動化交易。
通俗來講,可以把那些基于復雜模型和算法的量化交易策略,抽象的看成是一個Y=f(X)的函數。
X代表了各種市場數據、經濟指標等等,也就是所有可能影響市場走勢的信息。這些可以是歷史價格、成交量、訂單簿數據、新聞情感、公司財報、宏觀經濟數據等等。
Y代表了模型的交易決策或預測,比如買入/賣出信號、倉位大小、預測的價格方向或波動率等。
這其實和神經網絡是一樣的,因為神經網絡的本質就是通過海量的數據來嘗試擬合或學習一個復雜的非線性函數。
所以現在的量化交易越來越普遍地使用神經網絡,尤其是深度學習模型。
只不過這種模型肯定都是不可能開源的,畢竟這都是人家吃飯的家伙事。
周昀越想越覺得可行。
如果真的能搞出來,毫不夸張的說,他就真的不缺錢了。
但是飯要一口口吃,科研也得一步步來。
想要訓練一個涵蓋整個股市的模型,光憑現在的資源肯定是遠遠不夠的,但是如果只是僅僅訓練一個可以預測一支股票的模型,周昀覺得,可以嘗試一下。
確定了接下來的研究方向,周昀當即就行動起來。
這種股票預測任務,在AI領域有一個專門的名詞叫做——TSF,即Time Series Forecasting,時間序列預測。
現有的TSF算法很多,但如果想將這些算法直接運用到股票交易的預測中,那不給你底褲虧光都算是不錯了,
畢竟如果真這么簡單的話,研究這些算法的人,一個個早就變成億萬富翁了。
主要的難點其實可以總結為兩個。
第一個就是高質量且海量的歷史數據,這個其實不難搞,就是麻煩,畢竟要把他們整理成可以訓練的數據還是需要一些處理的。
第二個就是算法本身了,別看很多論文里把自己的算法吹的有多牛逼,但那都是在特定數據集上的結果,
事實上很多算法別說換數據集了,哪怕是稍微調整一下數據集的數據分布,結果都會大為不同。