AI 導入 KPI 檢核系統
AI

AI 導入 KPI 檢核系統

決策簡報 ・ 系統導覽與導入決策說明

推動 AI 落地各部門 ・ 把「用得好不好」變成可衡量的管理事實

107受評同仁
20單位
3職類分流
414自動驗收全綠
v1.7.0已開發完成

Intellineuron ・ 製作者 Joe.Wu

決策主頁

一分鐘掌握:做了什麼、解決什麼、花多少、帶來什麼。

做了什麼一套把「AI 實際導入與應用能力」量化、可審核、彙總進考績的系統。已開發完成(v1.7.0、414 項自動驗收全綠、支援 ChatGPT/Claude/Gemini 三家)。
解決什麼讓「哪些部門真的用 AI、用到多深」第一次有客觀數字,取代靠印象的評分。
花多少(示意・待確認)內網自建、零新增授權費;AI 用量月估 $__(每日上限控管防飆升)、導入約 __ 人天。
帶來什麼推動 AI 落地各部門、提高應用深度;領導層用一張儀表板看清全公司採用熱度與卡點。

標「示意・待確認」之數字為估算,待公司核實後替換。

一、為什麼是現在

問題

公司已投入推動 AI,但「哪些部門真的用起來、用到多深」沒有客觀數字;靠印象評分,容易淪為合規劇場,資源也投不到對的地方。

機會

把「AI 是否落地、應用多深」變成可量化的管理事實 —— 讓訓練、工具與獎勵投到真正在用、用得好的人與部門,加速全公司 AI 轉型。

二、這套系統解決什麼

一條從個人到全公司、可衡量可審核的完整鏈路:

前置・主管+總管理① 設定目標部門重點 + 每人五構面目標,兩段審核放行
每期・員工② 自評 + 月報五構面自評,每月月報夾帶任務快照
每期・主管③ 循序核定初審 → 終審主管依證據逐期給分
每期・總管理④ 最終核准第三期定案,全公司儀表板掌握卡點
半年・結算⑤ 等第入考績A–E 等第 → AI 應用能力職能(佔 20%)
階段做什麼
前置(兩段關卡)主管擬定部門重點 + 每人「具體、可執行」的 AI 應用目標 → 總管理兩段審核放行。
個人逐期自評五構面 + 每月月報(夾帶任務狀態快照作為過程證據)。
主管逐期依任務完成與月報證據評分、核定;單位多主管者「初審 → 終審」循序會簽;退回需附說明。
總管理最終核准 + 全公司導入度儀表板(採用率/深度/卡點一頁掌握)。
結算半年彙總個人 A–E 等第 → 併入考績(AI 應用能力職能)。

三、商業價值與投資效益

價值主軸:推動 AI 進入各部門、提高應用程度。

價值驅動

  • 把「用 AI」變成可評分的職能 → 全員有明確動機把 AI 真正帶進日常工作流,而非淺嚐。
  • AI 輔助起草「具體、可執行、可截圖/可量化」的個人目標 → 降低「不知道怎麼用 AI」的部門門檻,直接提高應用深度。
  • 儀表板即時呈現各部門採用率與應用深度 → 卡住的部門能即時補訓練與輔導,把資源投到對的地方。

預期效益示意・待確認

指標目標
AI 活躍採用率現況待測 → 目標 ≥ 80%(活躍使用人數 / 107)
應用深度(L2+ 滲透率)目標 ≥ 40%(深度整合進工作流)
各部門覆蓋率20 單位全數完成前置、進入評核
評核彙整工時半年約 __ 人天 → 約 __ 人天(系統自動彙總)

導入成本示意・待確認

項目估算
AI 用量(三供應商)月估 $__(每日總量上限控管,防飆升)
導入人時前置 + 輔導 約 __ 人天
軟體授權內網自建,零新增授權費

四、導入範圍與成熟度

涵蓋全公司 107 位受評同仁、20 個單位,依工作性質分流為三職類:

職類人數評核方式工具
研發 (rd)82五構面 1–10 + token 佐證ChatGPT + Claude
一般職務 (biz)23五構面 1–10ChatGPT
非知識崗 (lite)20–5、≥3 通過(獨立計)手機 ChatGPT

四種角色 × 能看 / 能做什麼

系統依角色只露該看的;同一人可身兼多角(例:主管也是受評員工)。

角色看得到能做看不到
員工自己的自評、月報、任務、半年等第填自評、送月報、上傳佐證他人分數、token 公式
主管所管單位每位成員的執行情況前置作業、逐期核定、循序會簽、月報審核、期前調任務非所管單位的成員
總管理全公司導入度儀表板、審核漏斗前置兩段終審、第三期最終核准、覆蓋填寫窗口、匯出(全覽,但不改主管已核分數,只把關)
admin帳號名冊、AI 金鑰、稽核日誌建帳 / 重設密碼 / 身份設定、金鑰與供應商、單位主管指派不參與評分(治理角色)

系統成熟度(可立即上線)

  • 已開發完成 v1.7.0,功能涵蓋帳號治理、兩段前置、逐期評分、儀表板、稽核。
  • 已通過 414 項自動化驗收(登入/權限/逐期計分/審核流/匯出),每次上版必跑全綠才放行。
  • 支援三家 AI(ChatGPT / Claude / Gemini),單家故障自動切換、用量有每日上限。

五、評分如何公平可信

設計原則(刻度是被刻意校準的)

  • 權重 20/30/50 遞增:前期給導入緩衝、最終看常態化成效。
  • A 線壓在 18(平均每構面 9 分):刻意從嚴,保留鑑別度 —— A 代表「可作為他人範例」。
  • 進步加分門檻 2 分:跨越一個半級距,屬可辨識的真實成長。
  • 保底機制:防前期衝高後鬆懈,確保看的是常態能力。

審核鏈:誰簽核、誰的分數算數

一筆分數要走完一條「不可逆、可追溯」的簽核鏈才定案:

順位角色做什麼佔最終分權重
員工自評對五構面自評打分(僅參照,不能單獨定分)單主管 20% / 雙主管 10%
初審主管單位若有多位主管,由初審主管先核定(終審看不到表單、改不動,直到初審簽完)雙主管時 30%
終審主管初審簽完才輪到終審核定;單一主管則由該主管核定單主管 80% / 雙主管 60%
總管理第三期所有主管簽完後做「最終核准」→ 半年等第定案把關、不改分

循序不可逆:多位單位主管必須「初審 → 終審」依序會簽,順序固定、前一位沒簽下一位無法動作;每位簽核者的評語都完整保留。誰能簽核,只看「單位主管指派」名單,與員工的直屬主管欄無關 —— 杜絕「非指定主管也能插手評分」。

三道防舞弊

  • 三道核定:自評僅參照(權重 10–20%)→ 主管循序核定(主導)→ 總管理最終核准,單方改不動分數。
  • 證據綁定:月報自動夾帶任務狀態快照;任務須「具體、可截圖或可量化、對應構面」才可評分。
  • 異常偵測:儀表板偵測單位異常集中(如全 B)或「token 客觀用量與自評背離」,可回退重評。

治理:全公司採同一套評分標準集中管理(改一處、全公司同步),杜絕各單位各自一把尺。完整規格見「評分機制規格」。

六、與既有考績如何接軌

  • 本系統評核的是「AI 應用能力」這一項職能,輸出個人 A–E 等第(0–20 分)。
  • 在公司既有六職能考績中,AI 應用能力佔權重 20%(非知識崗 5%);其餘 80% 為出勤、核心職能、專業職能、工作表現、人才培育。
  • 不取代既有考績,而是補上「AI 職能」這一塊客觀證據;半年結算後由總管理核定、彙整至人資。

AI 應用能力在六職能考績中的位置

職能項現制權重
工作表現32%
核心職能 / 專業職能各 16%
AI 應用能力(本系統)20%
出勤 / 人才培育各 8%

七、上線時程

全員一次上線,分三階段推進:上線準備 → 三期評核 → 半年結算。

階段工作內容時間負責人
階段一 上線準備匯入名冊與帳號、完成前置作業(主管擬定部門重點與個人目標 → 總管理審核)上線前總管理 + 各單位主管
階段二 三期評核全員逐期自評 → 主管核定 → 總管理最終核准(每 2 個月一期,共三期)7–12 月員工 + 主管 + 總管理
階段三 半年結算產出個人 / 部門報告,彙整進考績期末總管理 + 人資

實際上線起始時間待確認。

八、風險、資安與個資保護

風險與因應

風險可能性衝擊因應(多已內建)
員工為衝量而灌水使用 AItoken 客觀用量 vs 自評背離抽查 + 主管依品質定稿 + 保底計分
淪為合規劇場(交差了事)月報過程證據 + 任務須具體可執行 + 主管核定
AI 供應商故障 / 漲價多供應商容錯自動切換(已內建)+ 每日用量上限
員工資料 / 評分外洩內網限定不對外 + 權限分層 + 金鑰僅存伺服器 + 稽核留痕
單位抗拒 / 不會用AI 輔助起草目標降門檻 + 主管輔導 + 分階段推進

資安:高層三問三答

您可能的疑慮本系統的回答
員工會不會偷用、AI 費用會不會失控?每帳號 / 每日用量設上限,超額即擋;所有金鑰用量全程稽核,費用看得到、控得住。
員工資料、評分會不會外洩?系統部署於公司內網、不對外開放;員工只見自己、主管限本部門;金鑰只存伺服器不顯示;送往 AI 的僅自評/目標文字,不含全公司名冊或他人評分。
評分會不會被灌水造假?自評 → 主管 → 總管理三道核定;token 客觀用量與自評分數背離可偵測;退回需附說明、全程稽核留痕。

個資與存取邊界

  • 權限分層:員工只見自己、主管限本部門、總管理全覽;匯出僅限本部門。
  • 資料留在公司內網,不外送第三方;AI 呼叫只送必要欄位,不送全名冊與他人分數。
  • 稽核日誌記錄登入、核准、退回、越權嘗試與金鑰操作(只記尾 4 碼、不記金鑰值)。

系統部署於公司內網、不對外開放,故採 HTTP;以「密碼前端預雜湊(不傳明文)+ 登入限流 + 帳號鎖定」作為風險補償 —— 已知並已處置的設計取捨,非疏漏。

九、成功如何衡量

上線後追蹤以下指標,判斷 AI 是否真的落地、應用是否加深:

成功指標目標(示意・待確認)量測時點
AI 活躍採用率≥ 80%(活躍人數 / 107)上線首月起每月
應用深度(L2+ 滲透率)≥ 40%每期
各部門覆蓋率20 / 20 單位上線準備完成
月報準時率≥ 90%每月
token 與自評背離異常率< 10%每月稽核
評核爭議件數較舊制下降半年

操作教學

完整的逐畫面教學已獨立成冊,涵蓋員工自評 → 月報 → 主管循序核定 → 總管理定案全流程:

📖 開啟「員工/主管考評 圖解教學」(32 頁) →

每頁聚焦一個畫面、圖上標號、逐步講解「看到什麼 / 你要做什麼 / 結果」;點圖可放大縮放。

評分機制規格

三期權重

評核期權重主軸
第一期 (7–8 月)20%導入起步
第二期 (9–10 月)30%深化應用
第三期 (11–12 月)50%常態化

五構面 × C / B / A 行為錨點每構面 1–10,6/8/10 = C/B/A

這是系統實際向每位員工展開的評分標準(各單位可在「本單位指標」欄客製,C/B/A 行為錨點一致):

構面C 達標(6)B 優良(8)A 卓越(10)
① 工具採用度每週 3 天每週 4 天每工作日 5 天
② 應用深度1 個固定場景建 1 個工作流≥ 2 工作流 / 可複製
③ 產出品質與查核尚可、偶需修穩定、有查核高品質、可作範例
④ 效率 / 效益初步效益接近目標達成 / 超越目標
⑤ 分享與創新擴散偶爾分享部門內分享被他部門採用 / 教學

員工自評與主管核定都對著這張表打分;「本單位指標」欄會換成該單位的實際工具與場景(例:財務部 → 對帳自動化、報表生成),但 C/B/A 的行為標準全公司一致,確保跨單位可比。

等第(半年總分,滿分 20)

等第門檻說明
A 卓越≥ 18可作為他人範例
B 優良15 – 17熟練且穩定
C 達標12 – 14現狀努力可達
D 待加強8 – 11需輔導
E 不及格< 8尚未上路

計分規則

  • 期分 = 五構面平均(各 1–10);半年總分 = 三期加權平均 × 2(滿分 20)。
  • 進步加分:第三期 − 第一期 ≥ 2 分 → 半年 +1。
  • 保底機制:若第三期 < 第一期 → 以第三期計。
  • 非知識崗(lite):單一 0–5、≥ 3 通過,獨立統計不混入知識崗平均。

研發 token 客觀佐證(L 級)

級距月 token對應錨點
L0 幾乎未用< 30,000工具採用度 ≤ C
L1 常態輔助≥ 30,000C–B
L2 深度整合≥ 150,000B
L3 高度整合≥ 600,000A 級佐證(須品質達標)

token 如何影響分數(完整公式)僅管理層理解,員工端不揭露

token 用量不直接計分,而是當主管在期前替該員工設了「本期 token 目標」時,以「達成率」作為客觀錨點,按 0.3 權重輕輕修正主管在構面①(工具採用度)的打分:

步驟規則
1. 達成率 → 錨點分達成率 = 實際用量 ÷ 主管設定目標。<0.25 → 4、≥0.25 → 6、≥0.5 → 7、≥0.75 → 8、≥1.0 → 9
2. 混入構面①構面① = 0.3 × 錨點分 + 0.7 × 主管原打分(四捨五入)
3. 品質閘封頂若構面③(品質)或④(效率)< 6 → 構面①封頂於 7(token 再高也不行)
4. 防灌水紅線token 永不直接定 A;員工不可手填、用量僅由 AI 後台匯入歸戶;目標期前設、期後鎖;最終仍由主管依品質核定
實例(主管原打構面① = 7)達成率錨點混合後構面①
達標超標1.2090.3×9 + 0.7×7 = 7.6 → 8
僅四成0.4060.3×6 + 0.7×7 = 6.7 → 7(不變)
超標但品質③ = 52.009品質閘封頂 → 7

軟性揭露原則:此公式只對管理層說明用以理解機制;員工端看不到門檻與公式,自評仍以實際能力為主,避免「為衝 token 而灌量」。無目標或無匯入用量時,完全不加權,純以主管打分為準。

評分實例拆解

用一位假想研發同仁「林家豪」走一遍,看分數怎麼從「五構面點選」一路長成「半年等第」。下列每個數字皆由系統計分引擎(scoring.js)實際算出,非示意。

步驟 1 每期五構面 → 期平均每構面 1–10

評核期① 工具採用度② 應用深度③ 產出品質④ 效率效益⑤ 分享擴散期平均
第一期(導入)766756.2
第二期(深化)878867.4
第三期(常態化)998978.4

期平均 = 五構面相加 ÷ 5。例:第一期 (7+6+6+7+5) ÷ 5 = 6.2。五構面必須「全部填」才算完整,否則該期不得定案 —— 防只挑一個構面打高分灌水。

步驟 2 三期加權 → 半年原始分權重 20 / 30 / 50

計算式子結果
加權平均6.2 × 0.2 + 7.4 × 0.3 + 8.4 × 0.57.66
換算滿分 207.66 × 215.32

後期權重更高(50%):看的是「常態化」階段的真實能力,前期低分只是導入緩衝。

步驟 3 兩條調整規則

進步加分(本例觸發 ✓)

第三期期均 − 第一期期均 = 8.4 − 6.2 = 2.2 ≥ 2 → 半年 +1 分。

跨越一個半級距,屬可辨識的真實成長,予以鼓勵。

保底防退步(本例未觸發)

若第三期 < 第一期 → 直接「以第三期計」(不讓前期衝高拉抬)。本例第三期 8.4 ≥ 第一期 6.2,不啟動

步驟 4 得出半年分與等第

項目
原始分(步驟 2)15.32
進步加分+ 1
半年總分(滿分 20)16.3
對照等第(B 15–17)B 優良(熟練且穩定)

對照:同一個人「第三期鬆懈」會怎樣

保底機制專治「前期衝高、後期放掉」。把上例第三期降到 7,看分數如何被壓回:

情境三期期均不保底會是實際(保底後)
穩定到底(原例)6.2 → 7.4 → 8.416.3 B
第三期鬆懈9.0 → 9.0 → 7.016.0(看似 B)14.0 C

讀法:第二列若按加權算是 16(B),但因第三期(7.0)低於第一期(9.0),保底規則「以第三期計」→ 7.0 × 2 = 14.0,落到 C。系統看的是你最後的常態能力,不是一時衝高。

非知識崗(lite)如何計

司機、總機等非知識崗走獨立刻度:每期單一 0–5 分,三期同樣 20/30/50 加權,≥ 3 即通過(pass);獨立統計、不混入知識崗的平均與等第,避免不同性質的人被硬比。

評核節奏與月報

整套評核每半年跑一輪,節奏與「什麼時候能填」都由系統管控:

時間軸每期 2 個月

期別涵蓋月份權重自評填寫窗口(預設)主管核定截止
第一期7–8 月20%期末隔日 ~ 期末 + 7 天期末 + 14 天
第二期9–10 月30%同上同上
第三期11–12 月50%同上期末 + 14 天 → 之後總管理最終核准

限時填寫(嚴格窗口):自評只在窗口內可送出,逾時會被擋下;總管理 / admin 可針對特定期別或單位「提早開放」或「延長」窗口(每次變更都留稽核紀錄)。這確保大家在同一時間基準上評核,也保留特殊情況的彈性。

月報(每月一次)= 過程證據

期評分看的是「半年結果」,月報則是「每月過程」,兩者互為佐證。每份月報包含:

欄位內容
AI 應用情境當月做了哪些 AI 應用(勾選 + 文字說明)
量化效益本月估計節省工時(數字)
產出 / 問題具體產出說明、遇到的問題或需要的協助
token 用量(研發)當月 ChatGPT / Claude token(由後台匯入歸戶,員工不手填)
任務狀態快照送出當下自動夾帶「個人任務完成情況」的歷史切片,日後不被後續變動覆寫
佐證截圖可上傳完工 / 用量截圖(魔術數驗證、≤ 5MB)

月報同樣由單位主管循序會簽核准(與期評分同一套初審 → 終審機制),可核准或退回 —— 過程證據也有人把關,不是填了就算。

任務:每期都有可評分的依據

每位成員每期有對應五構面的個人任務(每期 5 槽,構面下拉)。主管在期開始前可增刪改任務、設定該期 token 目標;期開始後該期鎖定(總管理仍可調),防止期中竄改評分依據。這條「任務 → 月報佐證 → 期評分 → 半年彙總」的鏈路,確保每人每期都有具體、可截圖、對應構面的評分依據,而不是憑空打分。

常見問題

員工與主管最常問的疑慮,先在這裡講清楚:

問題回答
這是在監控員工嗎?不是。系統評的是「AI 應用能力」這一項職能(佔考績 20%、非知識崗 5%),目的是推動 AI 落地、把訓練與資源投到對的地方,不是監控個人行為。
我還不太會用 AI,會不會被打很低?不會被為難:① 主管用 AI 幫你起草「具體可做」的目標,降低不知如何下手的門檻;② 三期權重 20/30/50,前期是導入緩衝;③ D / E 是「需輔導」訊號,搭配主管輔導,不是懲罰。
自評打高一點是不是就贏了?沒用。自評只佔最終分 10–20%(主管核定主導);而且五構面必須全填、要有月報與任務證據,只挑一構面灌高分會被閘門擋下、會被退回。
那 token 用很多就是高分?不是。token 只以 0.3 權重「輕修」主管在構面①的打分,且品質(③)或效率(④)< 6 時直接封頂於 7;token 永遠不能單獨換到 A。
不同單位會不會各打各的尺?不會。全公司用同一套 C/B/A 行為標準集中管理(改一處、全公司同步);再加三道核定、單位主管循序會簽、稽核留痕,杜絕各自一把尺。
我的資料與分數安全嗎?系統只在公司內網、不對外;員工只見自己、主管限本部門;送往 AI 的僅自評/目標文字,不含全公司名冊或他人分數;金鑰只存伺服器、稽核不記金鑰值。
主管會不會很花時間?AI 一鍵生成部門簡述與個人目標、整單位一鍵帶入、儀表板一頁看全組執行情況、月報與評分可批次處理。
忘了填會怎樣?每期有限時窗口 + 首頁提醒;逾時會鎖定,但總管理 / admin 可針對特殊情況提早開放或延長(留稽核)。

名詞表

名詞說明
三職類研發(ChatGPT+Claude)/ 一般職務(ChatGPT)/ 非知識崗(手機、pass/fail)。
五構面工具採用度、應用深度、產出品質與查核、效率/效益、分享與創新擴散。
三期半年分三個評核期(每 2 個月),權重 20/30/50。
前置兩段關卡階段一(主管擬工作說明)→ 總管理審核 → 階段二(部門重點+個人目標)→ 總管理最終接受。
月報當月 AI 應用的過程證據;送出時自動夾帶任務狀態快照。
token L 級研發 token 用量的客觀級距(L0–L3),僅供參考,不直接計分。
初審主管 / 終審主管單位有多位單位主管時,依指派關係排序;初審主管先核定,終審主管後核定,循序不可逆。誰能簽核只看「單位主管指派」名單。
最終核准第三期所有主管簽完後,由總管理做的最後一道核准,半年等第於此定案。
填寫窗口自評可送出的時間區間(預設:期末隔日 ~ 期末+7);逾時鎖定,總管理可提早開放或延長。
進步加分第三期期均 − 第一期期均 ≥ 2 → 半年 +1 分,鼓勵真實成長。
保底機制第三期 < 第一期 → 以第三期計,防前期衝高後鬆懈。
達成率(token)實際用量 ÷ 主管設定目標;查錨點後以 0.3 權重混入主管側構面①,品質不足(③④<6)封頂。
等第 A–E半年總分(滿分 20)對應:A≥18、B 15–17、C 12–14、D 8–11、E<8。
導入度儀表板總管理視角的全公司彙總:平均、達標率、L3+ 滲透率、等第分布、三期趨勢、單位落點。
員工 / 主管考評 圖解教學1 / 0
100%
放大檢視
滾輪或雙擊縮放(最大原圖高清) ・ 按住拖曳移動 ・ 點空白或 Esc 關閉