Combining samples of student work with rubrics

Authors: Elizabeth King
With 20 blank faces staring back at me, it was clear that no formative assessment was required. We had definitely not met the success criteria for this session: ‘To understand the features of an effective poetry recital and the criteria set out in the poetry recital rubric.’

After painstakingly working through the criterion on the rubric, discussing what each might look like and clarifying unfamiliar words, my students were no clearer about the expectations of the poetry recital assessment. I, like many other teachers, thought that rubrics clearly articulated the expectations of assessments and would naturally promote achievement. However, there is little empirical evidence to support this intuitive belief (Andrade, Du, & Wang, 2008) and the bewildered faces staring back at me certainly did not add any anecdotal weight to the argument either.

When the time came to begin preparing to teach poetry again, the blanks faces still haunted me. The near uselessness of the rubric for my students troubled me and I continued to question how I could make the expectations of assessments clear to students. Professional reading as part of my school’s Explicit Improvement Agenda led me to Dylan Wiliam’s research on Formative Assessment. His 2015 book with Siobhan Leahy, Embedding formative assessment, suggested one small change to my practice to better utilise rubrics: Start with samples of work, rather than rubrics, to communicate quality.

Following William and Leahy’s advice, I went back to recordings of previous student recitals. I shared two performances with my class and opened up a discussion of each. Together we had a rich discussion exploring the features, strengths and weaknesses of both performances. We then benchmarked both performances according to the rubric. This enabled to students to anchor the once vague and decontextualised descriptors in the rubric to concrete, achievable examples. It also facilitated fierce debate amongst students about the level achieved by each performance.

This, in turn, forced students to delve into the language of the rubric and use differences in the level of each criterion to justify their thinking. Not only could my students now explain why the performances reflected particular levels set out in the rubric, they could also explain why they were above or below other levels.

In subsequent sessions, we also developed practical steps for improving the weaknesses we identified in each performance. Providing peer feedback and self-assessment provided students with opportunities to use these skills in developing and implementing constructive feedback to lift the standard of their performances.

Combining rubrics with samples of work has created powerful opportunities for my students to develop a clear picture of assessment tasks and develop the ability to improve their work.

How to use student samples of work

  1. Starting with a whole class discussion about two samples of work: In my experience, students find it easier to identify the qualities of good work when they are contrasting samples than when given a single sample, irrespective of the strength of the other piece.
  2. Asking students to decide which piece is better and describe why: I’ve found the Think-Pair-Share technique is a terrific tool to use in these discussions to give students time to think about the qualities of strong and weak pieces. This technique also provides the opportunity to develop and use vocabulary for assessing improving their work.
  3. Allowing students to annotate the sample: I encourage my students to identify and justify the strengths, weaknesses, limitations, qualities they want to incorporate into their own work, features they recognise in the piece and, most importantly, how to improve the piece. Discussions around improving the work are key – they generate ideas for improving one’s own work, send a clear message to students that every piece of work can be improved and prevent students from copying work because of a misconception that what you present is how it should be done.

What samples to use

When beginning this approach, I found it preferable to have one sample that was relatively weak and one that was strong. However, as students become more adept at identifying the differences in quality between different samples, I’ve used more samples and pieces that are much closer in quality.

Anonymous samples of student work are the key – ideally from previous years, students in other classes or from other schools. Wiliam and Leahy highlight how using anonymous work takes the emotion out of analysing a sample. ‘Assessing one’s work, as well as assessing the work of one’s peers in the classroom is emotionally charged, and the emotional resonances can often interfere with engaging in the demands of the task. However, assessing the work of the anonymous other is emotionally neutral, so students are able to focus more effectively on the task.’ (Wiliam & Leahy, 2015)

Once you have a collection of samples, you can make deliberate choices about which ones you will use with your students. I’ve found that selecting samples showing common errors students make and dispelling the misconceptions they have – such as longer answers always being better – are more effective. There will be errors specific to your subject disciplines that you know students make year after year.

When students notice the mistakes of others, they are less likely to make the same mistakes in their own work. You can find samples that include the features of strong and weak pieces you want to highlight. This allows students to expand conditions of possibility for their work and develop their skills in improving their work.

Developing independent learners is at the heart of formative assessment. I would, therefore, encourage teachers to seek out resources on formative assessment, particularly those focused on activating students as owners of their own learning and as resources for one another.


Andrade, H., Du, Y., & Wang, X. (2008). Putting Rubrics to the Test: The Effect of a Model, Criteria Generation, and Rubric-Referenced Self-Assessment on Elementary School Students' Writing. Educational Measurement: Issues And Practice, 27(2), 3-13.

Andrade, H. & Valtcheva, A. (2009). Promoting Learning and Achievement Through Self-Assessment. Theory Into Practice, 48(1), 12-19.

Black, P. & Wiliam, D. (2009). Developing the theory of formative assessment. Educational Assessment, Evaluation And Accountability, 21(1), 5-31.

Wiliam, D. & Leahy, S. (2015). Embedding formative assessment. Victoria: Hawker Brownlow Education.

Melihat 20 wajah dengan ekspresi kosong menatap balik ke arah saya, jelas sudah bahwa di tahap ini siswa belum siap untuk menjalani penilaian formatif. Dapat dipastikan bahwa kami belum mencapai kriteria sukses untuk sesi ini: “Rubrik tentang pemahaman mengenai aspek-aspek yang menentukan pembacaan puisi yang efektif serta kriteria pencapaian yang ditetapkan dalam pembacaan puisi.”

Setelah bersusah-payah menerjemahkan setiap kriteria pada rubrik, mendiskusikan bagaimana sekiranya bentuk ideal dari masing-masing kriteria, sekaligus menerangkan kata-kata yang masih asing, siswa saya masih tetap belum benar-benar memahami ekspektasi yang diharapkan dari penilaian pembacaan puisi. Seperti halnya banyak guru lain, saya mengira bahwa ekspektasi penilaian dalam rubrik sudah terartikulasi dengan jelas dan dengan demikian dapat mendorong pencapaian para siswa. Tapi ternyata hanya sedikit bukti empiris yang ikut mendukung keyakinan yang sifatnya intuitif tersebut (Andrade, Du, & Wang, 2008) dan wajah-wajah bingung di hadapan saya jelas tidak mampu memperkaya materi anekdotal apa pun terhadap argumen tersebut.

Sewaktu bersiap mengajarkan puisi lagi, wajah-wajah dengan ekspresi kosong itu masih menghantui saya. Rubrik yang nyaris tidak ada gunanya bagi siswa masih membebani perasaan saya, dan membuat saya mempertanyakan bagaimana cara untuk memperjelas ekspektasi yang diperlihatkan oleh rubrik kepada para siswa. Dengan adanya tugas membaca tulisan profesional sebagai bagian dari gerakan Explicit Improvement Agenda di sekolah saya, saya menemukan riset dari Dylan Wiliam tentang Asesmen Formatif. Buku berjudul Embedding Formative Assessment (Menanamkan Penilaian Formatif) yang ditulis oleh Dylan bersama dengan Siobhan Leahy di tahun 2015 menyarankan satu perubahan kecil dalam cara pengajaran saya agar dapat memanfaatkan potensi rubrik dengan lebih baik: Mulailah dengan menggunakan contoh dari hasil karya yang pernah dibuat oleh siswa, alih-alih langsung menggunakan rubrik, untuk mengomunikasikan kualitas pekerjaan yang diharapkan.

Mengikuti saran William dan Leahy, saya berusaha menemukan rekaman pembacaan puisi siswa yang sudah lewat untuk kemudian memutar dua rekaman pembacaan puisi bersama para siswa dan membuka kesempatan untuk mendiskusikan masing-masing rekaman pembacaan. Kami sekelas kemudian terlibat dalam suatu diskusi yang kaya, di mana kami mengeksplorasi fitur-fitur, kelebihan, dan kelemahan dari kedua pertunjukan tersebut. Bersama-sama, kami menilai keduanya berdasarkan tolak ulur yang disediakan rubrik. Hal ini membuat para siswa dapat memahami lebih baik tentang deskriptor-deskriptor dalam rubrik yang tadinya masih samar dan tidak berkonteks, untuk menjadi contoh-contoh konkret yang dapat dicapai. Kegiatan tersebut juga memfasilitasi ajang debat yang seru di antara para siswa mengenai skor yang mereka anggap sesuai dari masing-masing pertunjukan.

Kegiatan ini ternyata mampu memaksa para siswa untuk mendalami bahasa rubrik serta menggunakan perbedaan-perbedaan dalam level setiap kriteria untuk memahami lebih baik pemahaman ataupun tebakan mereka mengenai capaian-capaian yang diharapkan. Sekarang siswa saya tidak hanya mampu untuk menjelaskan alasan mengapa kedua pertunjukan itu mampu mencapai level-level tertentu yang ditetapkan oleh rubrik, namun juga mengapa posisi yang satu bisa lebih tinggi atau lebih rendah dari yang lain.

Pada sesi-sesi berikutnya, kami mengembangkan langkah-langkah praktis untuk memperbaiki kelemahan-kelemahan yang kami temukan di setiap pertunjukan. Dengan adanya masukan dari sesama siswa dan penilaian mandiri dari mereka sendiri, siswa lalu memiliki kesempatan untuk menggunakan keterampilan-keterampilan ini untuk mengembangkan dan mengimplementasikan masukan yang membangun demi peningkatan standar pertunjukan mereka.

Menggabungkan rubrik dan sampel hasil karya siswa telah menciptakan peluang yang luar biasa bagi siswa saya untuk membayangkan suatu gambaran yang cukup gamblang akan proses penilaian, juga melaluinya, mengembangkan kemampuan untuk memperbaiki kerja mereka sendiri.

Cara menggunakan sampel karya

1.      Mulailah dengan diskusi bersama yang melibatkan satu kelas tentang dua sampel karya: Berdasarkan pengalaman saya, para siswa lebih mudah mengenali kualitas dari sebuah karya yang baik ketika mereka dapat membandingkan beberapa sampel, dibandingkan hanya menganalisis satu sampel saja, terlepas dari apakah sampel yang satu kualitasnya lebih baik atau tidak dari yang lain.

2.      Tanyakanlah pada siswa, mana sampel yang lebih baik dan mintalah alasannya: Saya mendapati bahwa teknik Think-Pair-Share (Pikirkan-Pasangkan-Bagikan) adalah metode yang sangat bagus untuk digunakan dalam kegiatan diskusi semacam ini, agar para siswa mendapatkan cukup waktu untuk mempertimbangkan kualitas dari sampel yang baik dan yang kurang baik. Teknik ini juga membuka peluang bagi siswa untuk mengembangkan dan menggunakan kosa kata sebagai bahan penilaian serta perbaikan karya mereka.

3.      Berilah kesempatan bagi siswa untuk membuat catatan tentang sampel-sampel tersebut: Saya mendorong para siswa saya untuk mengenali dan membuktikan kekuatan, kelemahan, batasan, serta kualitas yang mereka ingin masukkan ke dalam karya mereka sendiri; berikut fitur-fitur yang mereka temukan dalam sampel, dan yang terpenting bagaimana cara memperbaiki karya tersebut. Diskusi seputar perbaikan karya adalah kuncinya—kegiatan ini dapat menghasilkan gagasan-gagasan yang berguna demi mencapai hasil kerja yang lebih baik bagi para siswa, juga mengirim pesan yang jelas pada mereka bahwa setiap karya selalu dapat ditingkatkan kualitasnya. Selain itu, kegiatan ini dapat mencegah siswa untuk dengan asal menyalin karya, karena adanya kesalahpahaman bahwa apa yang Anda (para guru) tampilkan untuk siswa merupakan contoh yang harus ditiru seutuhnya oleh mereka.

Sampel seperti apa yang sebaiknya digunakan?

Ketika memulai pendekatan ini, saya mendapati bahwa lebih mudah untuk menyajikan satu sampel yang relatif kurang baik berdampingan dengan sampel lain yang lebih baik. Namun demikian, setelah para siswa menjadi lebih mahir dalam mengenali perbedaan kualitas dari sampel-sampel yang berbeda, saya mulai menggunakan sampel-sampel karya yang kualitasnya tidak jauh berbeda.

Sampel karya siswa harus anonim—sebaiknya dari tahun sebelumnya, dan dari siswa kelas-kelas lain atau bahkan dari sekolah lain. William dan Leahy menggarisbawahi pentingnya menggunakan karya anonim untuk mencegah terlibatnya faktor emosional dalam menganalisa sampel. “Menilai sebuah karya, terutama menilai karya salah satu teman sekelas, bisa melibatkan suatu emosi tertentu, dan adanya emosi tersebut sering kali berpengaruh dalam pengerjaan tugas. Di sisi lain, menilai karya yang anonim sifatnya netral secara emosi, sehingga para siswa lebih dapat fokus pada tugas mereka dengan lebih efektif.” (William & Leahy, 2015)

Setelah Anda memiliki suatu koleksi sampel, Anda dapat dengan hati-hati mengambil keputusan tentang sampel mana yang akan Anda berikan kepada siswa-siswa Anda. Saya mendapati bahwa hampir selalu lebih efektif untuk memberikan sampel yang menunjukkan kesalahan-kesalahan umum siswa untuk selanjutnya membetulkan kesalahpahaman yang ada selama ini—misalnya bahwa jawaban-jawaban panjang selalu lebih baik dibanding jawaban pendek. Sebagai pengajar, tentu Anda dapat mengenali kekeliruan-kekeliruan spesifik di salah satu subyek mata pelajaran yang Anda tahu hampir selalu dilakukan para siswa dari tahun ke tahun.

Di saat siswa dapat melihat kesalahan yang dibuat oleh sesama siswa, akan lebih sedikit kemungkinan mereka mengulangi kesalahan yang sama dalam pekerjaan mereka. Anda bisa mencari sampel-sampel yang menampilkan fitur-fitur dalam karya yang baik dan kurang baik yang ingin Anda soroti. Hal ini akan membantu siswa untuk memperluas keyakinannya tentang kemungkinan-kemungkinan yang mampu mereka capai untuk menciptakan karya yang lebih baik serta meningkatkan keterampilan demi perbaikan karya ke depan.

Membentuk siswa yang mampu berpikir independen merupakan esensi dari asesmen formatif. Oleh karena itu saya ingin mendorong para pengajar untuk mencari sumber-sumber penunjang asesmen formatif, terutama yang berfokus pada upaya untuk mengaktifkan kesadaran siswa untuk menjadi pemilik dari proses dan hasil belajar itu sendiri. Juga untuk menjadi sumber bagi satu sama lain.


Andrade, H., Du, Y., & Wang, X. (2008). Putting Rubrics to the Test: The Effect of a Model, Criteria Generation, and Rubric-Referenced Self-Assessment on Elementary School Students' Writing. Educational Measurement: Issues And Practice, 27(2), 3-13.

Andrade, H. & Valtcheva, A. (2009). Promoting Learning and Achievement Through Self-Assessment. Theory Into Practice, 48(1), 12-19.

Black, P. & Wiliam, D. (2009). Developing the theory of formative assessment. Educational Assessment, Evaluation And Accountability, 21(1), 5-31.

Wiliam, D. & Leahy, S. (2015). Embedding formative assessment. Victoria: Hawker Brownlow Education.

Choose a topic you’re going to be teaching this year that you’ve taught before: What were some of the common student mistakes and misconceptions in previous years? How could you incorporate samples of work into your practice to highlight these? How will you ensure the pieces of student work that you select remain anonymous?

Pilihlah sebuah topik yang Anda ajarkan di tahun ini yang pernah Anda ajarkan sebelumnya: Seperti apakah kesalahan-kesalahan yang umumnya dibuat para siswa dan apa saja kesalahpahaman yang terjadi di tahun-tahun sebelumnya? Bagaimanakah Anda dapat menggabungkan sampel-sampel karya siswa ke dalam praktik Anda untuk menyoroti kedua hal di atas? Bagaimanakah cara Anda untuk memastikan bahwa karya-karya siswa yang Anda pilih tetap anonim?

