目前位置: 首頁 > 公開課程 > 創新研發 > 專業技術 > PyTorch人臉辨識模型實作

PyTorch人臉辨識模型實作

本課程也將介紹近年逐漸興起的Transformer架構在人臉辨識中的應用

  PyTorch人臉辨識模型實作-本課程將以「深度學習基礎影像分類模型」開始,帶領學員剖析人臉辨識的演進脈絡,逐步介紹目前最主流的人臉辨識技術。從早期基於Softmax Loss的人臉分類模型,到後來能有效提升辨識能力的Triplet Loss與Angular Margin Loss系列方法(SphereFace、CosFace、ArcFace),再進一步介紹近年提出的CurricularFace、ElasticFace與AdaFace等更先進的loss function,使模型在不同品質與難度的人臉影像下仍能保持良好的辨識能力。

加入收藏
收件人email:
寄件人姓名:
寄件人email:
 
課程總覽
課程代號:2326040032  
PyTorch人臉辨識模型實作
1. 熟悉 Python 與 PyTorch 深度學習框架
2. 瞭解人臉辨識技術的演進、架構與核心理論
3. 建立完整的人臉辨識系統(Face Detection → Recognition)
4. 訓練與比較不同的人臉辨識 loss function
5. 瞭解 Transformer 在電腦視覺中的應用
6. 掌握生成模型與對抗攻擊在人臉辨識中的應用


課程型態/ 數位課程
上課地址/ 線上直播會議室 (使用WEBEX線上會議室,將於課前寄發信件通知)
時  數/ 12 小時
起迄日期/ 2026/08/01 ~ 2026/08/15
聯絡資訊/ 李小姐   02-2370-1111#316

報名截止日期:2026/07/25

---------------------------------
課程介紹

 

人臉辨識(Face Recognition)是電腦視覺中最重要的應用之一,已廣泛運用於機場自動通關、智慧門禁、手機解鎖,到社群媒體中自動標記功能等場景。隨著深度學習技術快速進展,人臉辨識在多項公開測評中表現優異,數據顯示其精準度已跨越人類辨識的門檻,具備高度可靠的實務應用價值。然而,要建立一套穩定且高效的人臉辨識系統,仍需理解背後複雜的模型架構、訓練方法與系統設計等實作流程。

本課程將以「深度學習基礎影像分類模型」開始,帶領學員剖析人臉辨識的演進脈絡,逐步介紹目前最主流的人臉辨識技術。從早期基於Softmax Loss的人臉分類模型,到後來能有效提升辨識能力的Triplet LossAngular Margin Loss系列方法(SphereFaceCosFaceArcFace),再進一步介紹近年提出的CurricularFaceElasticFaceAdaFace等更先進的loss function,使模型在不同品質與難度的人臉影像下仍能保持良好的辨識能力。

人臉偵測(Face Detection)方面,本課程將介紹從早期的DlibMTCNN,到目前業界廣泛使用的RetinaFaceSCRFD等高效能人臉偵測模型,說明如何利用YOLO系列模型訓練專用的人臉偵測器。透過這些模型,學員將了解完整的人臉辨識系統是如何從一張影像中偵測人臉、進行對齊(Face Alignment),再輸入人臉辨識模型產生人臉特徵向量(Face Embedding),並利用距離度量完成身份辨識。

此外,本課程也將介紹近年逐漸興起的Transformer架構在人臉辨識中的應用,例如Face TransformerSwinFace等模型,說明CNNTransformer在人臉辨識任務中的差異與優勢。

除了辨識技術,本課程亦關注近年備受重視的「隱私與安全議題」。在社群媒體盛行的當下,日常照片分享正無形中洩露您的生物特徵。近年來的研究顯示,透過對抗攻擊(Adversarial Attack)或生成模型,可以在幾乎不影響人類視覺的情況下,使人臉辨識模型無法正確辨識身份。本課程將介紹FGSMPGD等對抗攻擊方法,以及如何利用生成模型(StyleGAN)進行人臉影像修改與StyleGAN inversion技術,以達到隱私保護或模型攻擊的目的。

 

 

課程目標

 

  1. 熟悉 Python  PyTorch 深度學習框架
  2. 瞭解人臉辨識技術的演進、架構與核心理論
  3. 建立完整的人臉辨識系統(Face Detection  Recognition
  4. 訓練與比較不同的人臉辨識 loss function
  5. 瞭解 Transformer 在電腦視覺中的應用
  6. 掌握生成模型與對抗攻擊在人臉辨識中的應用

 

 

課程對象

 

  1. 影像處理、電腦視覺與安控系統相關從業者
  2. 欲了解 CNN  Transformer 於視覺任務差異與應用的開發者
  3. 對生物特徵資訊安全與個人隱私防護有需求的資安人員
  4. 未來可銜接進階生成式 AI 或多模態技術的工程與研究人員
  5.  Python 程式基礎、希望透過完整專案實作進入 AI 領域的學生與轉職者

 

 

課程大綱-1

 

Day1.人臉辨識系統核心技術

課程大綱

內容

深度學習影像分類模型

  • 深度學習影像辨識的基礎與發展:
  • AlexNet
  • VGG
  • GoogLeNet
  • ResNet
  • EfficientNet
  • Vision Transformer (ViT)
  • CNN   Transformer 架構比較與應用

人臉偵測模型(Face Detection

<各世代的人臉偵測技術>

  • 早期方法
  • Haar Cascade
  • Dlib
  • 深度學習人臉偵測模型
  • MTCNN
  • RetinaFace
  • SCRFD
  • 即時物件偵測模型
  • YOLOv1 – YOLOv13
  • YOLO-based Face Detection
  • 實作:
  • 使用 WIDER FACE dataset 訓練 YOLO 人臉偵測模型
  • 比較 MTCNNRetinaFaceSCRFD   YOLO 的效果差異

人臉對齊(Face Alignment

  • 介紹人臉關鍵點偵測與對齊技術
  • 5-point alignment
  • 68-point landmarks
  • similarity transform
  • 說明對齊對人臉辨識精度的重要影響

 

 

課程大綱-2

 

Day2.人臉辨識模型與損失函數

課程大綱

內容

人臉辨識模型(Face Recognition

  • 介紹人臉辨識模型的核心概念:
  • Face embedding
  • cosine similarity
  • identity verification vs identification
  • 常見 backbone
  • ResNet
  • MobileFaceNet
  • ConvNeXt
  • Transformer-based face recognition
  • Face Transformer
  • SwinFace

人臉辨識 Loss Function 發展

<分類 到 metric learning 的演進

  • 基礎方法
  • Softmax Loss
  • Metric Learning:
  • Triplet Loss
  • Angular Margin Loss:
  • SphereFace
  • CosFace
  • ArcFace
  • 新一代人臉辨識 Loss:
  • CurricularFace
  • ElasticFace
  • AdaFace
  • 實作:
  • 使用CASIA-WebFace 訓練不同 loss function 的模型並比較效果

人臉辨識資料集與評估方法

  • 常見資料集
  • CASIA-WebFace
  • MS1M
  • VGGFace2
  • 評估資料集
  • LFW
  • MegaFace
  • IJB-C
  • 評估指標
  • Verification accuracy
  • ROC curve
  • TAR / FAR

 

 

課程大綱-3

 

Day3.人臉生成與隱私保護模型

課程大綱

內容

生成模型與人臉影像生成

  • 生成式模型基礎:
  • GAN-based models
  • DCGAN
  • StyleGAN
  • StyleGAN2 / StyleGAN3
  • Diffusion-based models
  • DDPM
  • DDIM
  • Latent Diffusion Model
  • Stable Diffusion

StyleGAN inversion 與人臉影像編輯

  • 介紹 StyleGAN inversion 技術:
  • GAN inversion
  • latent space editing
  • identity manipulation
  • 應用:
  • 年齡修改
  • 表情修改
  • 人臉辨識攻擊
  • 隱私保護

對抗攻擊(Adversarial Attack

  • 介紹對抗攻擊在人臉辨識中的應用:
  • FGSM
  • PGD
  • 實作:
  • 攻擊圖片分類模型
  • 攻擊人臉辨識模型

基於生成模型的人臉隱私保護

  • 生成模型在人臉隱私保護中的應用:
  • CLIP2Protect
  • adversarial identity perturbation
  • privacy-preserving face modification

★    本課程所有實作均使用 PyTorch 深度學習框架,並在 Google Colab雲端環境 上進行。

★    課程將提供完整資料集與程式範例,使學者能在短時間掌握人臉辨識系統設計與實作方法。

 

 

講師簡介-林講師

 

學歷:

台灣大學應用力學研究所碩士/清華大學資訊工程研究所博士

 

現職:

瑞典自駕車軟體開發公司Zenseact(Volvo Cars)深度學習工程師

 

經歷:

馬來西亞偉特科技公司(ViTrox)研發顧問

馬來西亞10 EPOCH科技公司研發顧問

工研院機械所副研究員/研究員/資深研究員

加州大學聖塔芭芭拉分校資工系訪問研究員

上奇資訊-計算機概論 共同譯者

2010 伽利略創新大賽 台灣區季軍

2011 伽利略創新大賽 特別獎(GNSS Living Lab)得主

2013 伽利略創新大賽 瑞士區冠軍

2016 日本立命館大學英文演講比賽 清華大學代表

2017 CVGIP 行人偵測競賽 亞軍

2017 MOST 生成式對抗網路競賽 佳作

2018第八屆兩岸清華研究生學術論壇 清華大學代表

2019 IEEE ICIP Three Minute Thesis Competition (3MT®): Finalist

2020 AI智慧應用新世代人才培育計畫-人才解題實證(倒車攝影機影像識別-障礙物與逼近偵測):佳作

2020 中華民國影像處理與圖形識別學會第十三屆博碩士論文獎博士論文佳作

 

專長:

Computer Vision, Image Processing, Pattern Recognition, Machine Learning, Deep Learning, Python/C/C++ Programming已於電腦視覺/深度學習/駕駛輔助/自駕車領域中發表過37篇國際論文,15篇國內論文,以及13篇專利

 

價格

 

報名方案

費用

課程原價

每人10,800

早鳥價 (開課前3)

每人9,800

團報價 (三人以上)

每人9,200

 

 

開課資訊

 

  • 主辦單位:工研院產業學院 台北學習中心
  • 舉辦地點:線上直播會議室 (使用WEBEX線上會議室,將於課前寄發信件通知)
  • 上課時間:115/08/0108/0808/15 ()13:00~17:00(每天4小時,共三天12小時)
  • 招生人數:本班預計20人為原則,最低開課門檻為12

 

 

注意事項

 

  1. 為確保您的上課權益,報名後若未收到任何回覆,敬請來電洽詢方完成報名。
  2. 若原報名者因故不克參加,但欲更換他人參加,敬請於開課前三工作日通知。
  3. 配合講師時間或臨時突發事件,主辦單位有調整日期或更換講師之權利。
  4. 報名時請註明欲開立發票完整抬頭,以利開立收據;未註明者,一律開立個人抬頭,恕不接受更換發票之要求
  5. 為尊重講師之智慧財產權,課程進行中請勿錄音及錄影。

 

 



報名截止日:2026/07/25

開課日:2026/08/01結束日:2026/08/15定價: $10,800

時數:12 (小時) 時段:13:00~17:00

地點:線上 | 線上同步學習 | 線上直播 [看地圖]

簡介


產業學院緣起
  依據行政院「挑戰2008:國家發展重點計畫」下之「國際創新研發基地」與「產業高值化」兩計畫,首重產業科技人才的效能。

•911216經科字第09103373120號函:經濟部將本院籌設工研院產業學院之工作,列為因應產業結構轉型,提 ... more

*填寫報名表能讓開課單位更有效的處理您的資料,並優先處理您的需求!


三聯式 二聯式


(重新產生)