Pierwszymi testami, które stosowano w praktyce, były egzaminy dla urzędników wprowadzone w Chinach już za czasów dynastii Sui, a więc ponad 1,5 tys. lat temu. Kandydaci do służby w administracji cesarskiej musieli wykazać się nie tylko znajomością dzieł Konfucjusza, ale także umiejętnością pisania, w tym i poematów, znajomością kaligrafii, retoryki, a nawet strzelania z łuku. Jak głoszą historycy, chiński wynalazek miał swoje bardzo praktyczne i polityczne źródła – cesarzowi zależało nie tylko na znalezieniu odpowiednich pracowników, ale także na odsunięciu od władzy arystokracji, która z racji urodzenia mogłaby liczyć na lepsze traktowanie oraz dopuszczenie do systemu władzy zdolnych, ale mało zamożnych, którzy całą swoją karierę zawdzięczaliby cesarzowi.
Jak widać, testy od samego początku nie tylko służyły temu, aby dokonywać bardziej sprawiedliwych i obiektywnych ocen czyichś umiejętności, ale były też narzędziem faworyzacji lub dyskryminacji pewnych grup społecznych i ich używanie – nawet jeśli dotyczyło sfery administracji czy edukacji – wiązało się z polityką.
Chociaż chińskie testy sprzed setek lat to już historia, do dziś przetrwała ich główna idea: standaryzacji i obiektywności oceny dokonanej za ich pomocą. Standaryzacja to inaczej mówiąc ujednolicenie – wszyscy testowani mają do rozwiązania te same zadania (albo porównywalne ze sobą, podobne co do poziomu trudności i rodzaju umiejętności, którymi trzeba się wykazać), rozwiązują test w tych samych warunkach i są następnie oceniani wedle tych samych reguł. Jeśli przyjąć, że w tych samych warunkach wszyscy mają takie same szanse, to należy założyć, że różnice, które pojawią się w wynikach, będą obrazem rzeczywistych różnic w poziomie umiejętności.