top of page
  • Black Facebook Icon
  • Black Instagram Icon
  • Black Yelp Icon

基因演算法 NSGAII

 

目前我們主要練習題目都使用NSGAII,因為我們在練習多目標的最佳化。首先我們先隨機產生一些基因(100組),根據我們所設定的目標函數計算出這些基因裡面最好基因,由最好至最爛開始排序,排好之後把他丟到一個非支配排序表(control table)裡面做一個非支配排序,然後從control table裡面取出最好的幾組基因(我們通常取前100組),先把這100組基因複製一遍變200組,先把最好的前3組基因保留(菁英保留策略),再從這200組基因選第3~100組做突變(隨機挑一個位置的基因把她隨機變成別的基因),101組~200組做交配(隨機挑選2組基因的幾個位置,讓他們跟另一組的基因做交換),好了之後就完成了第一次迭代,再把第二代這200組基因做排序,排好了之後取前100組放進control table,再把control table進行非支配排序,接著就一直重複這幾個動作,當她一直迭代排序之後找到一組與我們所設定的目標值最接近的基因時,這組基因就是我們要的最佳化的基因。

22.png
23.png

機器學習

 

 

大概有分為監督式、非監督式、強化式學習,我們這學期主要是練習監督式學習。監督式學習又可分為分類問題與迴歸問題(Classification、Regression)。要讓機器學習東西需要先給它大量資料,但是資料都要先經過處理,要先檢查有沒有缺失值、重複值,然後作特徵工程,從原有的資料中,人工的創造出一些新資料,可以第A比 + 第B比之類的,特徵工程做完之後做特徵轉換,數值資料如果有些差異過大可以先取log再做,如果不是數字的資料稱為類別資料,要先把他們轉成數字,因為電腦只會讀取數字,都做完後把這些特徵做縮放,也就是資料標準化、正規化,最後就是選擇自己想要套用的訓練模型,然後印出模型的評估和優化。

19.png
18.png

Qlik視覺化軟體

 

 

我們把全球開放的疫情資料抓取下來,放入Qlik視覺化軟體去做分析,把資料變成圖表。其中可以選取各個國家,來做確診、死亡、治癒的比較。

31.jpg
30.png

1061648 李岱謙

 

 我從暑假開始教導python爬蟲,由於我完全沒碰過python,因此一開始是非常吃力的,但是在助教一步一步的教學下,慢慢地學會一點python的語法及技巧套件等,學會從網站抓取資料,再匯入到python內進行爬蟲的撰寫,最後轉成excel檔案,這些都是我一大突破。

    這學期我也選了邱老師計算式智慧專題的研究所課程,其中在研究所的課程內老師告訴了我們二大重點,分別是預測和最佳化,老師舉了很多業界的例子和以前指導過的學生曾經做過的案例,發現目前各公司都是圍繞著預測和最佳化這二個部分,從問題的源頭,再來到分析,最後解決都是需要複雜的考量,讓我學到不少概念。而學了理論之後,接下來就是技術的部份,把問題理論套用在python裡面,進行演算法的分析,由於演算法的部分實在困難,因此我們花了很多的時間在上面,不僅找時間去問助教問題,也問了周遭的同學,花了相當大的功夫。而在人工智慧方面,老師上課給我們看了當前運用在現實上的例子,也說了很多理論,像是深度學習、影像辨識等,我認為在現在這個趨勢下,人工智慧是很有前景的,雖然現在有許多人已經在發展,像是Tesla的自駕車,但還是有許多車禍的案件發生,這就是機器學習不夠透徹,還不夠發展成熟,因此學到這門課讓我對人工智慧有更進一步的了解,也讓我更有興趣去探討這方面的議題。

    在暑假期間,我們的題目是要用到影像辨識,所以要學的東西更多,有時間就去問研究所的助教,而教授也會告訴我們可以有甚麼方向去做,雖然可能沒那麼好,但我依然拿出百分百的力氣去完成,這也是讓自己不斷提升的方法。

    綜合這學期以來,不僅是在技術方面或著是理論方面,都讓我受益良多,從剛開始的懵懂到現在會使用軟體配件來分析資料,都是很大的進步,有點成就感了。但是我認為還有許多發展的空間,還有很多東西要去學習,因此不能因為做出了一點成果就自傲鬆懈,好還要更好,所以我會更努力的獲取知識、學習,為未來到職場之前培養更多的能力。

1061649 巫懿倫

 

 

 一開始實習的時候,很多人對python都不太熟悉,所以老師在寒假期間就給了大家一個寒假作業,要專題生們去爬柏克萊的網站,練習爬蟲與一些基礎的python的語法,再來就是將抓到的這些數據利用Qlik做一個視覺化的呈現,讓大家分析看看有什麼特別之處。

    大家對python語法有基本的熟悉度之後,在研究所的課堂上教了大家幾個演算法,其中最常用到的是基因演算法NSGAII,這種演算法是要保留優秀的基因,再從這些優秀的基因中試著找出更好的基因,直到已經找不到更好的為止,我們也練習了很多最佳化的應用。在大學部的課堂中,我們也學到了一些機器學習的東西,分類與回歸,我們用深度學習對相片做分類。

這些練習我覺得非常的困難也很耗時,但是學到了很多東西,雖然我不太會打程式,但是因為我對視覺化的部分比較沒有那麼多興趣,所以在組別中我分配到了打程式的位置,需要找很多網站跟演算法的文獻資料來學習,這讓我來到了大學階段最認真的時期。

    原本專題生們有些都互相不太認識,因為兩班的學生都有,所以不是大家都那麼熟,但是因為實習的東西很難,老師要求的東西很多,大家都不太會,常常都會聚再一起討論,所以認識了很多同學。研究所的學長人也很好,我們有程式不會的問題的時候,他們都很細心地教我們,還會找很多案例給我們看,據我所知我們是暑假最常meeting的組別,老師也很願意花時間跟大家meeting,暑假每個禮拜都會從台中過來學校指導大家。這一年的專題實習也快結束了,雖然應用可能不是非常熟悉,但是大家花了很多時間做出來的成果,我覺得學到了很多新的東西,也得到了很好的實習經驗。

1061658 馬毅凱

    上學期我對於大數據與人工智慧完全是門外漢,幸好系上有校內專題的機會能夠讓我學習有關大數據的知識與應用,從一開始上課教授就教導我們有關python的爬蟲知識,並且教導我們有關視覺化分析的工具,剛好今年碰到了疫情關係,所以在暑假前我們就是針對疫情做了視覺化分析,到了暑假期間,我們針對圖像辨識的方向做研究,並且同步對財政部中獎發票資料做視覺化分析,在經過教授的指導下,我們在暑假期間,學習到了更多有關圖型辨識的技巧,所以我們就做了獼猴辨識。我覺得在專題中學習到了很多之前學不到的,資管系上開了這個制度真的好棒棒。

    經過這次的校內專題實習,我學到了許多平常必修課學習不到的重要知識,教授經常安排我們與碩士生一起上課,讓我們能夠更深入的了解研究主題,從做專題之前,助教訓練我們python爬蟲的技術與觀念,為了讓我們後續能夠順利蒐集大數據資料,進入正式實習後教授陸續指導NSGA演算法,並提出許多使用AI進行預測與最佳化的案例,同時也指導我們使用Qlikview & Qlicksense進行視覺化分析,並結合時事分析COVID-19肺炎對於世界的走向與挖掘亮點分析。 校內專題實習讓我更清楚了解AI到底在做什麼,並讓我們之後可以在業界使用到,不但可以提升自己的能力也可以獲得時事研究的機會,我認為是非常必要的。

bottom of page