AWS Summit Taipei 2018


p_20180628_112459_vhdr_on
經典的"Not Hotdog" live demo

今年有幸代表MOPCON參與長年贊助商AWS舉辦的台北高峰會,從議程的分布很明顯感覺到今年在AI部份的強調,也確實體現在實際講題的內容與推出的新產品服務上面,我特別喜歡由AWS 方案架構部亞太區新興技術主管 Olivier Klein做的這場表演,在現場傳遞熱狗跟獨角獸氣球展示AI能力的表演,有種科技演唱會的感覺,意外的是居然沒有引起全場大笑,是大家已經麻痺了還是沒成為Jian-Yang的腦粉呢?後面對全場做人臉辨識就讓人不禁想起Circle這部科技驚悚片裡面的場景了,不過這畢竟是不可擋的趨勢,端看人怎麼去運用這些技術了。

今年高峰會在主議程的前一天多設置了新的AWS x Twitch Gamer Lounge與AWS Game Day,應該也是看到近年來台灣在獨立遊戲方面的開發能量愈來愈強,具有進軍國際市場的水平,且生態系也開始成熟,因此能夠辦出這樣的活動,由於我主要參與DevOps跟AI的議程就沒有跑去聽遊戲方面的題材了,想想沒去拍個照學習一下還是蠻可惜的。

p_20180628_121633_vhdr_on
主議程前一天的培訓場次與遊戲開發相關議程

第一天的場次因為我大多時間在看整個場地的規劃以及了解攤位,加上有一些任務要處理所以沒有很仔細的聽議程內容,大概就是了解了有Sagemaker這個很好很強大的工具可以快速佈建可使用的AI model,總共有12種預設的演算法可以調用,適用於影像辨識、語音辨識、自然語言處理等等領域,在第二天的議程會有更深入的介紹。

p_20180628_134137_vhdr_auto
今年新設的Developer Lounge,讓開發者可以跟講者有近距離的互動問答

第二天的議程裡面除了很有特色的Keynote之外,也安排了許多重量級的講者跟業界的實際案例,當中我最喜歡的是KKStream的場次跟Developer Lounge的設置,Developer Lounge是今年新的嘗試,主要目的在於透過比較小型的空間,讓講者跟參與者之間的距離可以縮短,採取簡單開場與大量QA的方式作實務經驗的交流,跟去年在MOPCON裡面利用Unconference場地做的AWS工作坊性質蠻像,但是更強調互動,與我去年設計的Recruiting panel很類似,可以說是在各種朝拜大神議程之中的一股清流啊!四場議程裡面我最想聽的是fourdesire(就是記帳城市的製作公司),可惜因為撞議程就沒去現場聽了,後來看別人的貼文對於fourdesire可以用兩位工程師跟AWS的服務就可以處理億級資料的這個能力感到十分驚艷,希望之後可以看到錄影!

接下來想要重點介紹SageMaker Deep Dive這場議程的內容,我覺得這場議程特別值得的地方在於不僅僅是提供了SageMaker操作的一些簡介與建議,更重要的在後面KKStream的羅博士提供的整體企業導入資料科學的作法與架構觀念,非常值得深入一看!

p_20180628_154147_vhdr_auto608530313.jpg
SageMaker深入探索的議程開場

如果想要深入的了解SageMaker,蠻推薦這個影片,手把手教你怎麼用SageMaker,簡單來說SageMaker是一個2017年開放的服務,運用Amazon內部累積的大量資料與資料科學家的努力,把一些已經訓練好的模型做成模組,讓資料科學工程師可以不用花太多時間在收集資料與清理資料、建模等步驟,只要透過遷移學習(Transfer Learning)的方式就可以讓企業快速的導入資料模型與資料科學去解決領域的相關問題。

p_20180628_155545_vhdr_auto163202758.jpg
SageMaker的Cloud Watch功能

SageMaker還提供了model training的效能監測服務,可以讓資料工程師直接設定監測點,同時測試各種參數並自動通知,減少等待模型訓練的時間,加速應用的程序,不用再自己設計這些模組。

p_20180628_160248_vhdr_auto556487584.jpg
KKStream帶來的實務經驗分享

接下來要談談這次我覺得收穫最多的一場議程,由於我自己特別關注資料科學在實際商業應用上的議題,因此對於這次KKStream帶來的講題感觸特別深,由於台灣的數位資料產業起步比較晚,大部分的企業對於如何應用資料以及如何組織團隊進行實務操作都沒有具體的經驗,這場議程提供的經驗與架構著實是十分珍貴的第一手情報。

p_20180628_160659_vhdr_auto1120127185.jpg
透過類比把企業面臨的問題轉換成既有資料科學可解的問題是解決問題的第一步

開場先介紹了KKStream是怎麼誕生的,在決定了解決的問題方向之後,第一步其實是把原有OTT的商業模式跟零售業的運作模式結合起來思考,發現裡面的共通性之後就可以很好的運用在零售業已經相當成熟的一些資料技術,這也是Amazon在這個領域的強項,以OTT服務來說,可分為內容=>編碼=>CDN=>展示店=>影片播放器五個階段,與零售業的撿貨=>包裝=>遞送=>消費者挑選商品=>使用商品的流程是可以類比的,搞清楚這個架構之後下一步需要思考的是企業的核心價值在於這個價值鍊的哪一個階段,對於OTT服務來說,在Engage階段的任務是最為重要的,跟零售店如何安排貨架上面的商品是一樣的概念,在數位服務裡面就是如何讓使用者開始探索,並推薦正確的內容給使用者,這部份就牽涉到了許多結構化與非結構化資料的綜合應用,還有領域的經驗與直覺。

p_20180628_161014_vhdr_auto1196304825.jpg
資料民主化與遊戲化的概念

在這張投影片裡面提到的重要觀念是資料民主化與遊戲化的設計,其實這邊資料民主化的意涵應該主要還是在於讓企業組織成員理解資料運用的價值,跟GDPR所關注的隱私與資料民主概念比較遠一點,以台灣的企業目前的階段來說,需要先從企業內部理解資料的價值,才能夠開始走入真正的資料民主化架構,所以我認為這邊的資料民主化比較接近企業內部的組織與文化改造。實際的使用以遊戲化為概念框架,實作起來其實就是常見的幾個功能,包含智慧通知、相似內容、探索更多與非結構化內容資料的理解。

p_20180628_162037_vhdr_auto1023380209.jpg
組織導入資料科學的成員架構

這張投影片我認為至為重要,這是目前許多傳統企業在面對資料科學的時候可能都沒想過的事情,在企業導入資料科學絕對不是從名校挖一個厲害的博士生來空降到一個很響亮的位置上就會達成的事情,而是需要組織一個完整的團隊,我有時候會用入邪教來比喻這件事情,因為採取這個策略會使得企業必須要不斷的投入更多資源,以獲得更多資料科學的支持,基本上會導致企業內部組織作一定的轉型。在這個架構裡面清楚的顯示了這件事情,最重要的角色就是Project Owner,這個角色不僅僅是要能夠主導資料科學,更重要的是能夠連結資料與企業商業價值的兩端,才能夠做出真正有效的決策,而這個架構又需要使用者、資料科學家、資料架構師(也可以說是資料工程師)與營運人員的支持才能夠有效運轉,以我自己的親身經驗來說,在規模比較小型的企業裡面通常只會佈屬PM、前端跟後端工程師,我通常一開始會以外部顧問的方式協助企業建立資料的模型,然後把資料模型可以處理的問題包裝成API讓前後端工程師可以用很簡單的方式去整合到他們的服務上面,然而後續的資料應用就需要收集更多的使用者回饋,這部份又會需要有內部的前後端工程師與資料工程師通力合作才能達成,因此在一般小型不是data driven的公司來說會相對要負擔更大的壓力與人力成本,最好採取漸進式的方式去做,不要一下子就想要做到非常大規模的改變。

p_20180628_162100_vhdr_auto
導入資料科學的專案生命週期

後面這張提到企業導入資料科學的專案生命週期,跟學術研究比起來多了8~9兩個階段,也就是實際部屬資料模型與營運的階段,通常學術研究論文發完就結束了,但在企業實際運作的過程會經常遇到一些動態資料上面的問題,例如資料的規模成長太快,導致存取成為瓶頸、或是原有的演算法如果不做平行化效能會大幅下降、甚或是機器學習模型參數的更新頻率需要作調整等等,都是實際營運上會碰到的問題,要解決這些問題又會回到前一張投影片的組織架構,如果沒有資料工程師、營運人員跟專案負責人的共同參與,企業在導入資料科學的中後期很容易又會遇到問題,因此很像是邪教一樣,一旦開始入教就很難回頭了。

接著用這張投影片清楚的說明導入資料科學之後,對於企業營運的指標帶來什麼樣的影響,對於實際採用資料科學來說,專案負責人若能夠清楚的表達出怎麼衡量成效,對於企業能夠持續使用資料科學的威力去改善服務以及增進成長動能都是非常重要的議題,然而這就牽涉到對於領域知識的理解以及資料工程甚至是UI/UX設計的環節,因此專案負責人的跨領域溝通能力在這個部分就會顯得特別重要。

p_20180628_162332_vhdr_auto1145531931.jpg

結尾的投影片用SageMaker的出現代表的趨勢作結,今年若要說是台灣產業的機器學習元年應該一點也不為過,我從開始接觸這個領域到現在這個領域開始火熱已經整整過了快十年,中間十年真的幾乎都是乏人問津的狀態,倒是今年忽然間大家似乎都忽然覺醒了,然而這個領域相關的知識跟技術,例如虛擬化、A/B testing、model的CI/CD、資料處理的管線化相關的知識、技術跟產業在矽谷已經蓬勃發展超過六年以上了,台灣長期缺乏資料產業的結果就是大部分的產業創新動能夠受制於人才不足與欠缺原生結構化資料的侷限,即使現在要急起直追,最好也是挑選具有利基的產業去做會比較有優勢,然而很現實的是這次的產業革命很可能就如同十年前行動網路跟行動app掀起的潮流一樣,當開始起步的時候就已經晚了好幾年的基礎建設,要一步登天是非常困難的,如果不好好把基礎觀念與架構處理好,最後還是很容易淪為炒短線的產業政策口號。

最後用美味的After Party餐點跟可愛的筆記本贈品作結,這次會議有廣島生蠔跟現切牛肉與馬卡龍真的是相當重本,在議程、內容、贈品的表現都相當令人驚艷,昨天也到AWS辦公室拜訪今年社群贊助的負責人,討論了一些關於中南部產業特性的議題,很期待今年能夠在MOPCON裡面跟AWS一起推出更多對開發者、新創公司以及中小企業更加有意義與內涵的內容,也請大家拭目以待囉!

廣告

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com 標誌

您的留言將使用 WordPress.com 帳號。 登出 /  變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 /  變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 /  變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 /  變更 )

連結到 %s