Mengumpulkan dan memeriksa semua data yang tersedia bukanlah sesuatu yang efektif dari segi biaya dan juga tidaklah praktis. Sebaliknya, sangatlah perlu untuk menarik sample dari keseluruhan populasi untuk memungkinkan pemeriksaan yang terinci dapat dilakukan. Sample diambil karena beberapa alasan; sebagai contoh untuk menarik inferences (kesimpulan) dari keseluruhan populasi atau untuk menarik contoh yang ilustratif dari beberapa jenis behaviour.

“Sampling menyediakan alat untuk mendapatkan informasi tentang populasi tanpa harus memeriksa keseluruhan populasi.”

Caveat

Sampling menyediakan metodologi yang valid dan dapat dipertahankan tetapi menjadi lebih penting untuk mencocokkan jenis sample yang diperlukan dengan analisa yang kita lakukan. Auditor harus berhati-hati untuk memeriksa kualitas informasi dari sample yang diambil. Jika kulitasnya tidak bagus maka sampling tidak dapat diterima.

Apakah kita benar-benar membutuhkannya?

Di NAO UK, dari 31 laporan yang diterbitkan akhir Juli 1999- 2000, ada 7 contoh yang menggunakan judgemental sampling untuk ilustrasi case study dan 24 contoh sampling untuk mernarik inferences dari keseluruhan populasi, dimana 19 diantaranya berbasis survey.

Apakah sampling bisa menyediakan evidence yang kuat?

Di bidang kesehatan, empat studi memperluas penggunaan samp[ling dan teknik survay untuk membentuk evidence yang diidentifikasi secara potensial dapat mengamankan keuangan sampai sejumlah 400 juta pound dan mungkin saving tahunan sebesar 150 juta pound.

Design Sampling

Design sample meliputi metode seleksi, struktur sample dan perencanaan untuk menganalisa dan menginterpretasikan hasilnya. Design sample bervariasi dari yang sederhana sampai yang kompleks dan bergantung pada jenis informasi yang diperlukan dan bagaimana sample dipilih. Desain ini akan berdampak pada ukuran sample dan bagaiaman cara melakukan analisis data.

Dalam istilah yang sederhana semakin kita membutuhkan precision (keakuratan) dan semakin kompleks desain yang kita buat maka ukuran sample akan semakin besar. Desain mungkin dapat membuat karakteristik populasi menjadi lebih dapat dipahami, tetapi tidak perlu harus terwakili secara proporsional. Mungkin perlu untuk menasik sample yang lebih banyak daripada yang dibutuhkan dari beberapa bagian populasi; sebagai contoh, memilih yang lebih banyak dari kelompok minoritas untuk menjamin mendapatkan data yang cukup untuk analisis group tersebut.

Banyak desain sample yang dibangun di seputar seleksi random. Hal ini memungkinakan inference yang layak dari sample ke populasi, pada tingkat keakuratan yang terkuantifikasi. Berkaitan dengan aspek lain dari desain, seleksi random meyediakan proteksi terhadap bias dalam memilih, sementara judgemental tidak dapat menghindarkan dari bias. Tetapi, seleksi random mungkin tidak selalu menyediakan apa yang dibutuhkan danb dalam kasus tertentu harus lebih diperhatikan untuk mencocokkan dengan tujuan audit untuk menghindari bias yang tidak diinginkan.

Mendefinisikan populasi

Langkah pertama desain sample yang baik adalah memastikan bahwa spesifikasi populasi yang menjadi target jelas dan selengkap mungkin untuk memastikan semua elemen dalam populasi terwakili. Populasi target disample menggunakan kerangka sampling. Sering unit dari populasi dapat diidentifikasi dari informasi yang ada: sebagai contoh, penggajian, daftar perusahaan, register pemerintah dsb. Kerangka sampling (frame sampling) dapat juga bersifat geografis; misalnya berdasarkan kode pos.

Semua frame sampling pasti mengandung beberapa kekurangan (defects), meskipun ada garansi/jaminan dari penyedia data. Biasanya ada beberapa cara untuk mengatasi hal ini, sebagai contoh merubah daftar, memilih sample yang lebih besar, dan menghapus sample yang tidak layak. Atau menggabungkan informasi dari berbagai sumber, atau menggunakan proxy data.

Ukuran sample

Untuk semua desain sample, memutuskan ukuran sample yang sesuai bergantung pada lima faktor kunci yang disajikan di bawah ini. Penting untuk mempertimbangkan faktor-faktor ini secara bersama untuk mencapai keseimbangan dan memastikan bahwa tujuan melakukan sample terpenuhi. Tidak ada estimasi yang diambil dari sebuah sample diharapkan pasti, kesimpulan dari populasi akan mengandung margin of error. Semakin baik desain, margin of error semakin rendah dan semakin baik akurasinya.

Jumlah variabilitas dari populasi seperti range nilai atau opini, akan berdampak pada akurasi dan selanjutnya ukuran sample diperlukan ketika mengestimasi sebuah nilai. Semakin banyak variabilitas, semakin rendah akurasi dari estimasi dan semakin besar sample yang harus diambil.

Confidence level, adalah tingkat keyakinan bahwa hasil yang didapatkan dari sample berada pada keakuratan yang diinginkan. Umumnya kita menggunakan 95% confidence untuk menyediakan kesimpulan yang kuat, tetapi jika anda hanya ingin mendapatkan indikasi dari nilai suatu populasi maka confidence level yang lebih rendah, say 90% dapat diterima.

Ukuran populasi umunya tidak berdampak pada ukuran sample. Kenyataannya, semakin besar ukuran populasi semakin rendah proporsi populasi yang perlu untuk diambil samplenya agar bisa terwakili. Hanya jika ukuran sample yang diusulkan lebih dari 5% dari populasi, maka ukuran populasi menjadi bagian dari rumus untuk menghitung ukuran sample.

Jika anda mencari atribut sample sebagai lawan dari menghitung nilai rata-rata, proporsi populasi yang menampilkan atribut yang anda cari adalah faktor akhir untuk pertimbangan kita. Ini didapatkan dari estimasi informasi yang diketahui dari populasi, sebagai contoh proporsi rumah sakit yang mempertimbangkan waiting lists yang menjadi suatu problem.

kata kunci: (Margin of error/Precision, The population proportion, variability in the population, confidence level)

http://www.nao.org.uk/publications/Samplingguide.pdf