2020-11-6 資深UI設計者
本文將針對酷家樂旗下云端建模工具——酷大師所做的可用性測試,說明工具型產品如何去做可用性測試。
打造一款產品的過程中,我們需要時刻保持警惕:功能是否滿足用戶核心需求?交互流程能否做到簡單流暢?是否還有未知領域可以由用戶帶來啟發(fā)?進行一次準備充分的可用性測試,無疑是解答上述問題快捷有效的方式。
下面我將結合本次針對酷家樂旗下云端建模工具——酷大師所做的可用性測試,說明工具型產品如何去做可用性測試。
測試目的不同,安排的測試任務就不同,進而就會影響最終得到的結果。所以測試之初需要考慮清楚測試目的。國際標準化組織在人體工程學設計的人機交互部分( ISO9241) 把b2可用性c 規(guī)定為 3 個指標:
結合這3個指標,我將本次測試目的設定為:
測試時間:
測試環(huán)境:
Nielsen在理論中認為5-8位用戶可以測試出85%的可用性問題,實踐下來確實如此,樣本數(shù)量建議控制在這個范圍。
在同一個產品的用戶中,新手用戶、永久的的中間用戶、專家用戶這三類角色通常是共存的。我們需要讓新手用戶快速和無痛苦地成為中間用戶;避免為那些想成為專家的用戶設置障礙;最為重要的是,讓永久的中間用戶感到愉快,因為他們的技能將穩(wěn)定地處于中間層。
本次測試中,我盡量使樣本中包含這3類用戶,比例為2:3:3。測試之后,就可以大概知道對于不同類型用戶來說,產品可用性和
易用性情況,也可以得到多維度差異化的反饋。
測試中需要使用一些管理用戶信息或記錄用戶反饋的表格,在準備階段就要做好表格設計和打印工作。下面是具體的表格,可根據(jù)具體需求做相應調整。
《用戶信息&排期表》
在這張表中管理測試用戶信息b2姓名、職業(yè)c 、測試安排「時間、地點」、測試工作人員「主持人、觀察員」。一場測試盡量安排一位主持人和一位觀察員作為工作人員相互配合。
主持人負責與用戶溝通互動,推進測試進程;觀察員負責設備和資料保障,以及測試過程中的行為觀察和記錄。一個人獨自承擔主持人+觀察員角色的話,在用戶反饋密集而現(xiàn)場又出現(xiàn)臨時狀況時就會手忙腳亂,所以建議兩個角色分工協(xié)作。
《用戶基本信息問卷》
在這張問卷中可以設計與產品相關的用戶基本信息問題,問卷設計原則為:
這張問卷使用在線工具呈現(xiàn),比如騰訊問卷;也可現(xiàn)場打印紙質問卷進行詢問填寫。大多數(shù)用戶比較喜歡現(xiàn)場填寫。
《單任務滿意度問卷》
測試過程中,我們需要讓用戶完成一個完整任務,該任務需要拆解成若干單任務。在每個單任務結束后,立刻對用戶進行該單任務的滿意度詢問。
《SUS系統(tǒng)可用性量表》
用戶結束完整任務后,填寫該量表。該量表由10個題目組成,包括奇數(shù)項的正面陳述和偶數(shù)項的反面陳述。在結果整理階段,我們再對該量表進行分值計算。
從開始到結束,需要主持人將整場測試的各個環(huán)節(jié)串聯(lián)起來,引導用戶操作,推動測試進程向前發(fā)展。為防止意外狀況出現(xiàn),可以預設測試腳本,規(guī)劃情境和話術,并在預測試環(huán)節(jié)驗證及優(yōu)化該話術。
比如可以這樣開場:“首先非常感謝您今天能來參加我們的可用性測試,我是主持人XXX,這位是觀察員XXX。我們這次是對酷大師建模工具進行可用性測試,想了解您使用時的體驗和感受。
在這里需要強調的是:我們測試的對象是工具,而不是您,所以您不必感到緊張……當您使用工具時,我們會觀察和記錄。今天的測試大概需要一個小時,測試過程中會有休息時間。測試過程中,請您將手機保持靜音狀態(tài)……“
比如可以這樣進行兩個單任務環(huán)節(jié)串場:“好的,我們已經完成了第一個單任務?,F(xiàn)在有一份簡單的問卷,填完后可以稍微休息一下。
「出示問卷,并作簡要填寫說明」「問卷完成后進行簡單訪談,用戶也稍稍休息后繼續(xù)」現(xiàn)在,我們開始進行第二個單任務「要清晰且大聲地說出這句話,以“鼓勵”測試參加者和提示記錄人員」……”
具體話術依據(jù)需要測試的內容和情境展開,盡量做到專業(yè)、友好。
可用性測試往往帶有一定目的性,而這些目的能不能達成,取決于任務與目的的關聯(lián)性以及用戶是否能夠給到對應反饋。通常,測試用戶是愿意給予反饋的,那么測試任務的設計就成為整個準備階段最重要的環(huán)節(jié)。
做好測試任務的設計和拆解:需要具備從全局高度理解產品的能力;需要知道產品全鏈路的過去起源、現(xiàn)狀細節(jié)、未來走向;需要把控重點,拎出骨架;需要去繁就簡,以較少的任務成本測出最有價值的信息。
本次測試中,我設計的主流程是:模型創(chuàng)建——材質鋪貼——模型渲染——模型發(fā)布——模型分享,并且我還希望測到拉伸、陣列、組編輯、移動、旋轉這樣的主功能。所以我將這兩塊有機結合,給到用戶創(chuàng)建一個「樓梯踏步模型」的任務。
我將任務按照主流程拆解為5個單任務,主功能分布到其中幾個單任務中,且盡量做到兩個單任務中不重復使用同一個主功能。
大多數(shù)產品都存在一些限制因素導致的尚未解決的已知問題。這些問題在測試中出現(xiàn)的話,會轉移用戶注意力,削弱本次測試的價值,偏移本次測試的目的。
另外,我們準備階段進行的種種規(guī)劃也需要得到驗證。結合這兩個原因,正式測試之前建議進行內部的用戶預測試。找出并修復測試環(huán)節(jié)中的漏洞,準備好各類突發(fā)狀況下的planB,以及修復影響正式測試的已知問題,提高正式測試的執(zhí)行效率。
第一步.測試開場,填寫《用戶基本信息問卷》
本次測試是在工作日穿插進行8場一對一用戶測試。這樣可以放緩測試節(jié)奏,在兩場測試間隙有充足時間簡單整理上一場收集的信息,與下一場用戶確認測試安排,以及對突發(fā)狀況及時處理。
正式開始前半小時,觀察員需確認設備都已調試妥當,資料都已打印完成。主持人可與用戶進行聯(lián)系,帶領用戶進入測試場所。主持人可以通過填寫《用戶基本信息問卷》了解用戶基本信息,幫助用戶消除在陌生環(huán)境下的溝通障礙。也可以使用戶以放松狀態(tài)完成測試任務,以開放心態(tài)為后續(xù)拓展性話題的展開做好準備。
無論是填寫《用戶基本信息問卷》還是后續(xù)的問卷,建議采用主持人提問、用戶回答的方式收集信息。用戶的注意力集中于思考和溝通,就能夠提供更多有價值的信息,而不是忙于撰寫問卷。
第二步.完成單任務,填寫《單任務滿意度問卷》
主持人按照順序分步解說單任務。單任務測試過程中,工作人員不要去打擾用戶,也不要給用戶任何提示,所有的問題都等到測試結束再進行解答。
觀察員需仔細觀察用戶操作,記錄用戶是否很容易判斷出如何操作,完成某個重要功能點時是否順暢;需隨時關注用戶表情,記錄下明顯表情相關聯(lián)的流程或功能點等等細節(jié)。
一個單任務完成后,提示用戶稍事休息,然后提問《單任務滿意度問卷》中的問題。此時可以回答用戶操作過程中的疑問,也可以藉由操作中的細節(jié)做延展發(fā)散,詢問用戶操作感受。通??梢垣@得很多針對該單任務的意見和建議。這些意見和建議后續(xù)就需要記錄整理,作為優(yōu)化任務幫助提升產品可用性和易用性。
第三步.填寫《SUS系統(tǒng)可用性量表》,了解整體評估
整個任務完成后,可以藉由填寫《SUS系統(tǒng)可用性量表》,了解用戶對整體的評估。由于量表的10個題目中,包括奇數(shù)項的正面陳述和偶數(shù)項的反面陳述,所以在提問過程中一定要陳述清楚題目。如果用戶認為有些問題無法回答,則視為其選擇中間值。在后續(xù)的結果整理階段,再對量表總分進行計算。
在問題詢問過程中,可以有針對性地詢問原因。比如針對第2個問題“我認為酷大師建模工具的操作較為復雜,其實沒必要這么復雜”。
如果用戶認為不復雜,則可以詢問哪些點非常簡單易用;如果用戶覺得復雜,則可以詢問哪些點覺得復雜。用戶告知原因的同時,常常會說出他認為比較簡單的解決方案。這些解決方案或者來自于競品,或者來自于實踐,或者來自于創(chuàng)新,常??梢詭椭覀冮_拓思路,走出認知盲區(qū)。
第四步.拓展性訪談,測試收尾
在這個環(huán)節(jié)可以不必拘泥于原定的測試任務。建議預留一定時間,大到行業(yè)發(fā)展,小到產品細節(jié),與用戶進行一番深度探討。這些來自于一線的用戶常常會帶來一些新鮮的靈感,為產品未來的拓展提供一些線索,解決產品當下的一些困惑。
由于我們一開始就對測試樣本進行了分類,所以也可以結合前面幾個環(huán)節(jié)的信息,對各分類下的用戶訴求和行為習慣進一步驗證、區(qū)分、歸納。
第一步.SUS量表分值計算
首先,我們需要計算SUS量表總分。奇數(shù)項計分采用“原始得分-1”,偶數(shù)項計分采用“5-原始得分”。由于是5點量表,每個題目的得分范圍記為0~4(最大值為40),而SUS的范圍在0~100,故需要把所有項的轉換分相加,最終再乘以2.5,即可獲得SUS分數(shù)。
其次,我們可以獲得分量表得分。SUS量表中,第4和第10項構成的子量表為“易學性”(Learnability),其他8項構成的子量表為“可用性”(Usability)。
為了使易學性和可用性分數(shù)能夠與整體SUS分數(shù)兼容,范圍也是0~100,需要對原始分數(shù)進行轉換:易學性量表轉換分數(shù)的總和乘以12.5,可用性量表乘以3.125。
最后,我們可以將SUS量表分數(shù)換算成百分等級來解釋,找到對應評級。百分等級的意思是指測量的產品或系統(tǒng)相對于總數(shù)據(jù)庫里其他產品或系統(tǒng)的可用性程度。比如SUS得分是73分,其百分等級大約為67,意味著比大約66%的產品可用性更好。
第二步.整理問題列表,推進迭代優(yōu)化
做完所有用戶的測試之后,我們一定會收集到很多涉及具體功能點的反饋。對于正向反饋,我們可以謙虛地接受,并且思考這些打動用戶的點如何復用;對于非正向反饋,我們應該冷靜地思考,它們將是本次可用性測試中最直接而有效的收獲!
對這些反饋可以進行分類歸納,將其中能夠立即應用于產品的內容整理出來,按照優(yōu)先級,放入產品迭代優(yōu)化任務中。這些任務將提高產品可用性,在數(shù)據(jù)層面能夠幫助提升留存率。我們這次可用性測試中總共獲取97個有效反饋,其中62個整理進產品迭代任務,并且取得了用戶使用數(shù)據(jù)上的相應提升。
第三步.撰寫測試報告
整個測試環(huán)節(jié)通常只有2-3位工作人員,如果希望能和團隊一起分享測試的收獲,建議整理一份總結報告??梢允褂脀ord或者ppt形式,說明測試背景、測試用戶信息、主要結論、發(fā)現(xiàn)的問題、以及解決問題的行動項。
經過幾場頗具收獲的工具型產品的可用性測試之后,我做了一些總結,希望能夠形成適應于工具型產品的可用性測試體系:
1. 目的性
工具型產品的可用性測試目的比較統(tǒng)一:幫助團隊優(yōu)化體驗路徑;幫助團隊明確用戶使用產品時的體驗感受;幫助設計師驗證設計指標。
2. 專業(yè)性
完整的可用性測試全程都需要專業(yè)支撐,從籌備到進行,從任務到結果,每一個細節(jié)都需要考慮到位。在這過程中我們要盡量保證:流程規(guī)劃清晰;文檔整理完整;分工明確到位。
3. 參與性
大多數(shù)可用性測試是用戶體驗相關崗位人員發(fā)起,但是用戶對于產品的反饋與團隊每位成員息息相關,所以建議團隊共同參與。比如在這次可用性測試中,就邀請了產品經理和研發(fā)人員擔當觀察員或主持人;邀請用研人員給予專業(yè)指導培訓;在對測試反饋的問題進行優(yōu)化過程中,也是團隊通力合作,推進迭代快速進行。
4. 周期性
可用性測試不是進行一次就結束的一場表演。而是結合產品進展情況,可持續(xù)實施的一種有效的快速驗證方式。
可以在新產品上線后進行,可以在重要功能上線前進行,也可以在迭代優(yōu)化后進行。建議周期性進行可用性測試,取得一些結果后立即應用于產品,隔段時間再次驗證,形成良性循環(huán)。亦趨近于精益用戶體驗中倡導的基本MVP理念。
當然,每次可用性測試都需要工作人員投入大量時間和精力,所以專業(yè)賦能可以成為很好的解決方案。即團隊成員可以學習使用該方法,輪流進行周期性操作。
我們日常其實接觸并積累了大量專業(yè)方法,可用性測試只是其中一種。在不斷實踐的過程中才能真正體會到這些方法的魅力之處,在不斷落地的過程中才能打磨自身的方法論體系,形成屬于自己的一套打法,給產品設計帶來新穎的專業(yè)思路。
文章來源:優(yōu)設 作者:酷家樂UED
藍藍設計( www.teruid.com )是一家專注而深入的界面設計公司,為期望卓越的國內外企業(yè)提供卓越的UI界面設計、BS界面設計 、 cs界面設計 、 ipad界面設計 、 包裝設計 、 圖標定制 、 用戶體驗 、交互設計、 網站建設 、平面設計服務