AI 導入 KPI 檢核系統

決策簡報・系統導覽與導入決策說明

推動 AI 落地各部門・把「用得好不好」變成可衡量的管理事實

107受評同仁

20單位

3職類分流

414自動驗收全綠

v1.7.0已開發完成

Intellineuron ・製作者 Joe.Wu

決策主頁

一分鐘掌握:做了什麼、解決什麼、花多少、帶來什麼。

做了什麼	一套把「AI 實際導入與應用能力」量化、可審核、彙總進考績的系統。已開發完成(v1.7.0、414 項自動驗收全綠、支援 ChatGPT/Claude/Gemini 三家)。
解決什麼	讓「哪些部門真的用 AI、用到多深」第一次有客觀數字,取代靠印象的評分。
花多少(示意・待確認)	內網自建、零新增授權費;AI 用量月估 $＿＿(每日上限控管防飆升)、導入約＿＿人天。
帶來什麼	推動 AI 落地各部門、提高應用深度;領導層用一張儀表板看清全公司採用熱度與卡點。

標「示意・待確認」之數字為估算,待公司核實後替換。

一、為什麼是現在

問題

公司已投入推動 AI,但「哪些部門真的用起來、用到多深」沒有客觀數字;靠印象評分,容易淪為合規劇場,資源也投不到對的地方。

機會

把「AI 是否落地、應用多深」變成可量化的管理事實 —— 讓訓練、工具與獎勵投到真正在用、用得好的人與部門,加速全公司 AI 轉型。

二、這套系統解決什麼

一條從個人到全公司、可衡量可審核的完整鏈路:

前置・主管+總管理① 設定目標部門重點 + 每人五構面目標,兩段審核放行

→

每期・員工② 自評 + 月報五構面自評,每月月報夾帶任務快照

→

每期・主管③ 循序核定初審 → 終審主管依證據逐期給分

→

每期・總管理④ 最終核准第三期定案,全公司儀表板掌握卡點

→

半年・結算⑤ 等第入考績A–E 等第 → AI 應用能力職能(佔 20%)

階段	做什麼
前置(兩段關卡)	主管擬定部門重點 + 每人「具體、可執行」的 AI 應用目標 → 總管理兩段審核放行。
個人	逐期自評五構面 + 每月月報(夾帶任務狀態快照作為過程證據)。
主管	逐期依任務完成與月報證據評分、核定;單位多主管者「初審 → 終審」循序會簽;退回需附說明。
總管理	最終核准 + 全公司導入度儀表板(採用率/深度/卡點一頁掌握)。
結算	半年彙總個人 A–E 等第 → 併入考績(AI 應用能力職能)。

三、商業價值與投資效益

價值主軸:推動 AI 進入各部門、提高應用程度。

價值驅動

把「用 AI」變成可評分的職能 → 全員有明確動機把 AI 真正帶進日常工作流,而非淺嚐。
AI 輔助起草「具體、可執行、可截圖/可量化」的個人目標 → 降低「不知道怎麼用 AI」的部門門檻,直接提高應用深度。
儀表板即時呈現各部門採用率與應用深度 → 卡住的部門能即時補訓練與輔導,把資源投到對的地方。

預期效益示意・待確認

指標	目標
AI 活躍採用率	現況待測 → 目標 ≥ 80%(活躍使用人數 / 107)
應用深度(L2+ 滲透率)	目標 ≥ 40%(深度整合進工作流)
各部門覆蓋率	20 單位全數完成前置、進入評核
評核彙整工時	半年約＿＿人天 → 約＿＿人天(系統自動彙總)

導入成本示意・待確認

項目	估算
AI 用量(三供應商)	月估 $＿＿(每日總量上限控管,防飆升)
導入人時	前置 + 輔導約＿＿人天
軟體授權	內網自建,零新增授權費

四、導入範圍與成熟度

涵蓋全公司 107 位受評同仁、20 個單位,依工作性質分流為三職類:

職類	人數	評核方式	工具
研發 (rd)	82	五構面 1–10 + token 佐證	ChatGPT + Claude
一般職務 (biz)	23	五構面 1–10	ChatGPT
非知識崗 (lite)	2	0–5、≥3 通過(獨立計)	手機 ChatGPT

四種角色 × 能看 / 能做什麼

系統依角色只露該看的;同一人可身兼多角(例:主管也是受評員工)。

角色	看得到	能做	看不到
員工	自己的自評、月報、任務、半年等第	填自評、送月報、上傳佐證	他人分數、token 公式
主管	所管單位每位成員的執行情況	前置作業、逐期核定、循序會簽、月報審核、期前調任務	非所管單位的成員
總管理	全公司導入度儀表板、審核漏斗	前置兩段終審、第三期最終核准、覆蓋填寫窗口、匯出	(全覽,但不改主管已核分數,只把關)
admin	帳號名冊、AI 金鑰、稽核日誌	建帳 / 重設密碼 / 身份設定、金鑰與供應商、單位主管指派	不參與評分(治理角色)

系統成熟度(可立即上線)

已開發完成 v1.7.0,功能涵蓋帳號治理、兩段前置、逐期評分、儀表板、稽核。
已通過 414 項自動化驗收(登入/權限/逐期計分/審核流/匯出),每次上版必跑全綠才放行。
支援三家 AI(ChatGPT / Claude / Gemini),單家故障自動切換、用量有每日上限。

五、評分如何公平可信

設計原則(刻度是被刻意校準的)

權重 20/30/50 遞增:前期給導入緩衝、最終看常態化成效。
A 線壓在 18(平均每構面 9 分):刻意從嚴,保留鑑別度 —— A 代表「可作為他人範例」。
進步加分門檻 2 分:跨越一個半級距,屬可辨識的真實成長。
保底機制:防前期衝高後鬆懈,確保看的是常態能力。

審核鏈:誰簽核、誰的分數算數

一筆分數要走完一條「不可逆、可追溯」的簽核鏈才定案:

順位	角色	做什麼	佔最終分權重
①	員工自評	對五構面自評打分(僅參照,不能單獨定分)	單主管 20% / 雙主管 10%
②	初審主管	單位若有多位主管,由初審主管先核定(終審看不到表單、改不動,直到初審簽完)	雙主管時 30%
③	終審主管	初審簽完才輪到終審核定;單一主管則由該主管核定	單主管 80% / 雙主管 60%
④	總管理	第三期所有主管簽完後做「最終核准」→ 半年等第定案	把關、不改分

循序不可逆:多位單位主管必須「初審 → 終審」依序會簽,順序固定、前一位沒簽下一位無法動作;每位簽核者的評語都完整保留。誰能簽核,只看「單位主管指派」名單,與員工的直屬主管欄無關 —— 杜絕「非指定主管也能插手評分」。

三道防舞弊

三道核定:自評僅參照(權重 10–20%)→ 主管循序核定(主導)→ 總管理最終核准,單方改不動分數。
證據綁定:月報自動夾帶任務狀態快照;任務須「具體、可截圖或可量化、對應構面」才可評分。
異常偵測:儀表板偵測單位異常集中(如全 B)或「token 客觀用量與自評背離」,可回退重評。

治理:全公司採同一套評分標準集中管理(改一處、全公司同步),杜絕各單位各自一把尺。完整規格見「評分機制規格」。

六、與既有考績如何接軌

本系統評核的是「AI 應用能力」這一項職能,輸出個人 A–E 等第(0–20 分)。
在公司既有六職能考績中,AI 應用能力佔權重 20%(非知識崗 5%);其餘 80% 為出勤、核心職能、專業職能、工作表現、人才培育。
不取代既有考績,而是補上「AI 職能」這一塊客觀證據;半年結算後由總管理核定、彙整至人資。

AI 應用能力在六職能考績中的位置

職能項	現制權重
工作表現	32%
核心職能 / 專業職能	各 16%
AI 應用能力(本系統)	20%
出勤 / 人才培育	各 8%

七、上線時程

全員一次上線,分三階段推進:上線準備 → 三期評核 → 半年結算。

階段	工作內容	時間	負責人
階段一　上線準備	匯入名冊與帳號、完成前置作業(主管擬定部門重點與個人目標 → 總管理審核)	上線前	總管理 + 各單位主管
階段二　三期評核	全員逐期自評 → 主管核定 → 總管理最終核准(每 2 個月一期,共三期)	7–12 月	員工 + 主管 + 總管理
階段三　半年結算	產出個人 / 部門報告,彙整進考績	期末	總管理 + 人資

實際上線起始時間待確認。

八、風險、資安與個資保護

風險與因應

風險	可能性	衝擊	因應(多已內建)
員工為衝量而灌水使用 AI	中	中	token 客觀用量 vs 自評背離抽查 + 主管依品質定稿 + 保底計分
淪為合規劇場(交差了事)	中	高	月報過程證據 + 任務須具體可執行 + 主管核定
AI 供應商故障 / 漲價	低	中	多供應商容錯自動切換(已內建)+ 每日用量上限
員工資料 / 評分外洩	低	高	內網限定不對外 + 權限分層 + 金鑰僅存伺服器 + 稽核留痕
單位抗拒 / 不會用	中	中	AI 輔助起草目標降門檻 + 主管輔導 + 分階段推進

資安:高層三問三答

您可能的疑慮	本系統的回答
員工會不會偷用、AI 費用會不會失控?	每帳號 / 每日用量設上限,超額即擋;所有金鑰用量全程稽核,費用看得到、控得住。
員工資料、評分會不會外洩?	系統部署於公司內網、不對外開放;員工只見自己、主管限本部門;金鑰只存伺服器不顯示;送往 AI 的僅自評/目標文字,不含全公司名冊或他人評分。
評分會不會被灌水造假?	自評 → 主管 → 總管理三道核定;token 客觀用量與自評分數背離可偵測;退回需附說明、全程稽核留痕。

個資與存取邊界

權限分層:員工只見自己、主管限本部門、總管理全覽;匯出僅限本部門。
資料留在公司內網,不外送第三方;AI 呼叫只送必要欄位,不送全名冊與他人分數。
稽核日誌記錄登入、核准、退回、越權嘗試與金鑰操作(只記尾 4 碼、不記金鑰值)。

系統部署於公司內網、不對外開放,故採 HTTP;以「密碼前端預雜湊(不傳明文)+ 登入限流 + 帳號鎖定」作為風險補償 —— 已知並已處置的設計取捨,非疏漏。

九、成功如何衡量

上線後追蹤以下指標,判斷 AI 是否真的落地、應用是否加深:

成功指標	目標(示意・待確認)	量測時點
AI 活躍採用率	≥ 80%(活躍人數 / 107)	上線首月起每月
應用深度(L2+ 滲透率)	≥ 40%	每期
各部門覆蓋率	20 / 20 單位	上線準備完成
月報準時率	≥ 90%	每月
token 與自評背離異常率	< 10%	每月稽核
評核爭議件數	較舊制下降	半年

操作教學

完整的逐畫面教學已獨立成冊,涵蓋員工自評 → 月報 → 主管循序核定 → 總管理定案全流程:

📖 開啟「員工/主管考評圖解教學」(32 頁) →

每頁聚焦一個畫面、圖上標號、逐步講解「看到什麼 / 你要做什麼 / 結果」;點圖可放大縮放。

評分機制規格

三期權重

評核期	權重	主軸
第一期 (7–8 月)	20%	導入起步
第二期 (9–10 月)	30%	深化應用
第三期 (11–12 月)	50%	常態化

五構面 × C / B / A 行為錨點每構面 1–10,6/8/10 = C/B/A

這是系統實際向每位員工展開的評分標準(各單位可在「本單位指標」欄客製,C/B/A 行為錨點一致):

構面	C 達標(6)	B 優良(8)	A 卓越(10)
① 工具採用度	每週 3 天	每週 4 天	每工作日 5 天
② 應用深度	1 個固定場景	建 1 個工作流	≥ 2 工作流 / 可複製
③ 產出品質與查核	尚可、偶需修	穩定、有查核	高品質、可作範例
④ 效率 / 效益	初步效益	接近目標	達成 / 超越目標
⑤ 分享與創新擴散	偶爾分享	部門內分享	被他部門採用 / 教學

員工自評與主管核定都對著這張表打分;「本單位指標」欄會換成該單位的實際工具與場景(例:財務部 → 對帳自動化、報表生成),但 C/B/A 的行為標準全公司一致,確保跨單位可比。

等第(半年總分,滿分 20)

等第	門檻	說明
A 卓越	≥ 18	可作為他人範例
B 優良	15 – 17	熟練且穩定
C 達標	12 – 14	現狀努力可達
D 待加強	8 – 11	需輔導
E 不及格	< 8	尚未上路

計分規則

期分 = 五構面平均(各 1–10);半年總分 = 三期加權平均 × 2(滿分 20)。
進步加分:第三期 − 第一期 ≥ 2 分 → 半年 +1。
保底機制:若第三期 < 第一期 → 以第三期計。
非知識崗(lite):單一 0–5、≥ 3 通過,獨立統計不混入知識崗平均。

研發 token 客觀佐證(L 級)

級距	月 token	對應錨點
L0 幾乎未用	< 30,000	工具採用度 ≤ C
L1 常態輔助	≥ 30,000	C–B
L2 深度整合	≥ 150,000	B
L3 高度整合	≥ 600,000	A 級佐證(須品質達標)

token 如何影響分數(完整公式)僅管理層理解,員工端不揭露

token 用量不直接計分,而是當主管在期前替該員工設了「本期 token 目標」時,以「達成率」作為客觀錨點,按 0.3 權重輕輕修正主管在構面①(工具採用度)的打分:

步驟	規則
1. 達成率 → 錨點分	達成率 = 實際用量 ÷ 主管設定目標。<0.25 → 4、≥0.25 → 6、≥0.5 → 7、≥0.75 → 8、≥1.0 → 9
2. 混入構面①	構面① = 0.3 × 錨點分 + 0.7 × 主管原打分(四捨五入)
3. 品質閘封頂	若構面③(品質)或④(效率)< 6 → 構面①封頂於 7(token 再高也不行)
4. 防灌水紅線	token 永不直接定 A;員工不可手填、用量僅由 AI 後台匯入歸戶;目標期前設、期後鎖;最終仍由主管依品質核定

實例(主管原打構面① = 7)	達成率	錨點	混合後構面①
達標超標	1.20	9	0.3×9 + 0.7×7 = 7.6 → 8
僅四成	0.40	6	0.3×6 + 0.7×7 = 6.7 → 7(不變)
超標但品質③ = 5	2.00	9	品質閘封頂 → 7

軟性揭露原則:此公式只對管理層說明用以理解機制;員工端看不到門檻與公式,自評仍以實際能力為主,避免「為衝 token 而灌量」。無目標或無匯入用量時,完全不加權,純以主管打分為準。

評分實例拆解

用一位假想研發同仁「林家豪」走一遍,看分數怎麼從「五構面點選」一路長成「半年等第」。下列每個數字皆由系統計分引擎(scoring.js)實際算出,非示意。

步驟 1　每期五構面 → 期平均每構面 1–10

評核期	① 工具採用度	② 應用深度	③ 產出品質	④ 效率效益	⑤ 分享擴散	期平均
第一期(導入)	7	6	6	7	5	6.2
第二期(深化)	8	7	8	8	6	7.4
第三期(常態化)	9	9	8	9	7	8.4

期平均 = 五構面相加 ÷ 5。例:第一期 (7+6+6+7+5) ÷ 5 = 6.2。五構面必須「全部填」才算完整,否則該期不得定案 —— 防只挑一個構面打高分灌水。

步驟 2　三期加權 → 半年原始分權重 20 / 30 / 50

計算	式子	結果
加權平均	6.2 × 0.2　+　7.4 × 0.3　+　8.4 × 0.5	7.66
換算滿分 20	7.66 × 2	15.32

後期權重更高(50%):看的是「常態化」階段的真實能力,前期低分只是導入緩衝。

步驟 3　兩條調整規則

進步加分(本例觸發 ✓)

第三期期均 − 第一期期均 = 8.4 − 6.2 = 2.2 ≥ 2 → 半年 +1 分。

跨越一個半級距,屬可辨識的真實成長,予以鼓勵。

保底防退步(本例未觸發)

若第三期 < 第一期 → 直接「以第三期計」(不讓前期衝高拉抬)。本例第三期 8.4 ≥ 第一期 6.2,不啟動。

步驟 4　得出半年分與等第

項目	值
原始分(步驟 2)	15.32
進步加分	+ 1
半年總分(滿分 20)	16.3
對照等第(B 15–17)	B 優良(熟練且穩定)

對照:同一個人「第三期鬆懈」會怎樣

保底機制專治「前期衝高、後期放掉」。把上例第三期降到 7,看分數如何被壓回:

情境	三期期均	不保底會是	實際(保底後)
穩定到底(原例)	6.2 → 7.4 → 8.4	—	16.3　B
第三期鬆懈	9.0 → 9.0 → 7.0	16.0(看似 B)	14.0　C

讀法:第二列若按加權算是 16(B),但因第三期(7.0)低於第一期(9.0),保底規則「以第三期計」→ 7.0 × 2 = 14.0,落到 C。系統看的是你最後的常態能力,不是一時衝高。

非知識崗(lite)如何計

司機、總機等非知識崗走獨立刻度:每期單一 0–5 分,三期同樣 20/30/50 加權,≥ 3 即通過(pass);獨立統計、不混入知識崗的平均與等第,避免不同性質的人被硬比。

評核節奏與月報

整套評核每半年跑一輪,節奏與「什麼時候能填」都由系統管控:

時間軸每期 2 個月

期別	涵蓋月份	權重	自評填寫窗口(預設)	主管核定截止
第一期	7–8 月	20%	期末隔日 ~ 期末 + 7 天	期末 + 14 天
第二期	9–10 月	30%	同上	同上
第三期	11–12 月	50%	同上	期末 + 14 天 → 之後總管理最終核准

限時填寫(嚴格窗口):自評只在窗口內可送出,逾時會被擋下;總管理 / admin 可針對特定期別或單位「提早開放」或「延長」窗口(每次變更都留稽核紀錄)。這確保大家在同一時間基準上評核,也保留特殊情況的彈性。

月報(每月一次)= 過程證據

期評分看的是「半年結果」,月報則是「每月過程」,兩者互為佐證。每份月報包含:

欄位	內容
AI 應用情境	當月做了哪些 AI 應用(勾選 + 文字說明)
量化效益	本月估計節省工時(數字)
產出 / 問題	具體產出說明、遇到的問題或需要的協助
token 用量(研發)	當月 ChatGPT / Claude token(由後台匯入歸戶,員工不手填)
任務狀態快照	送出當下自動夾帶「個人任務完成情況」的歷史切片,日後不被後續變動覆寫
佐證截圖	可上傳完工 / 用量截圖(魔術數驗證、≤ 5MB)

月報同樣由單位主管循序會簽核准(與期評分同一套初審 → 終審機制),可核准或退回 —— 過程證據也有人把關,不是填了就算。

任務:每期都有可評分的依據

每位成員每期有對應五構面的個人任務(每期 5 槽,構面下拉)。主管在期開始前可增刪改任務、設定該期 token 目標;期開始後該期鎖定(總管理仍可調),防止期中竄改評分依據。這條「任務 → 月報佐證 → 期評分 → 半年彙總」的鏈路,確保每人每期都有具體、可截圖、對應構面的評分依據,而不是憑空打分。

常見問題

員工與主管最常問的疑慮,先在這裡講清楚:

問題	回答
這是在監控員工嗎?	不是。系統評的是「AI 應用能力」這一項職能(佔考績 20%、非知識崗 5%),目的是推動 AI 落地、把訓練與資源投到對的地方,不是監控個人行為。
我還不太會用 AI,會不會被打很低?	不會被為難:① 主管用 AI 幫你起草「具體可做」的目標,降低不知如何下手的門檻;② 三期權重 20/30/50,前期是導入緩衝;③ D / E 是「需輔導」訊號,搭配主管輔導,不是懲罰。
自評打高一點是不是就贏了?	沒用。自評只佔最終分 10–20%(主管核定主導);而且五構面必須全填、要有月報與任務證據,只挑一構面灌高分會被閘門擋下、會被退回。
那 token 用很多就是高分?	不是。token 只以 0.3 權重「輕修」主管在構面①的打分,且品質(③)或效率(④)< 6 時直接封頂於 7;token 永遠不能單獨換到 A。
不同單位會不會各打各的尺?	不會。全公司用同一套 C/B/A 行為標準集中管理(改一處、全公司同步);再加三道核定、單位主管循序會簽、稽核留痕,杜絕各自一把尺。
我的資料與分數安全嗎?	系統只在公司內網、不對外;員工只見自己、主管限本部門;送往 AI 的僅自評/目標文字,不含全公司名冊或他人分數;金鑰只存伺服器、稽核不記金鑰值。
主管會不會很花時間?	AI 一鍵生成部門簡述與個人目標、整單位一鍵帶入、儀表板一頁看全組執行情況、月報與評分可批次處理。
忘了填會怎樣?	每期有限時窗口 + 首頁提醒;逾時會鎖定,但總管理 / admin 可針對特殊情況提早開放或延長(留稽核)。

名詞表

名詞	說明
三職類	研發(ChatGPT+Claude)/ 一般職務(ChatGPT)/ 非知識崗(手機、pass/fail)。
五構面	工具採用度、應用深度、產出品質與查核、效率/效益、分享與創新擴散。
三期	半年分三個評核期(每 2 個月),權重 20/30/50。
前置兩段關卡	階段一(主管擬工作說明)→ 總管理審核 → 階段二(部門重點+個人目標)→ 總管理最終接受。
月報	當月 AI 應用的過程證據;送出時自動夾帶任務狀態快照。
token L 級	研發 token 用量的客觀級距(L0–L3),僅供參考,不直接計分。
初審主管 / 終審主管	單位有多位單位主管時,依指派關係排序;初審主管先核定,終審主管後核定,循序不可逆。誰能簽核只看「單位主管指派」名單。
最終核准	第三期所有主管簽完後,由總管理做的最後一道核准,半年等第於此定案。
填寫窗口	自評可送出的時間區間(預設:期末隔日 ~ 期末+7);逾時鎖定,總管理可提早開放或延長。
進步加分	第三期期均 − 第一期期均 ≥ 2 → 半年 +1 分,鼓勵真實成長。
保底機制	第三期 < 第一期 → 以第三期計,防前期衝高後鬆懈。
達成率(token)	實際用量 ÷ 主管設定目標;查錨點後以 0.3 權重混入主管側構面①,品質不足(③④<6)封頂。
等第 A–E	半年總分(滿分 20)對應:A≥18、B 15–17、C 12–14、D 8–11、E<8。
導入度儀表板	總管理視角的全公司彙總:平均、達標率、L3+ 滲透率、等第分布、三期趨勢、單位落點。