GAME THEORY (TEORI PERMAINAN)
Sejarah teori permainan dimulai dari
diskusi awal contoh permainan dua orang yang
terjadi jauh sebelum munculnya teori permainan matematika modern.
Pembahasan pertama yang diketahui dari teori permainan terjadi dalam surat yang
ditulis oleh James Waldegrave pada
tahun 1713. Lalu seorang ahli matematika Perancis yang bernama Emile Borel pada
tahun 1921 membuktikan teorema minimax untuk dua orang zero-sum game matriks hanya jika matriks pay-off adalah simetris.
Namun yang paling terkenal adalah
teori permainan modern yang dimulai dengan ide tentang adanya campuran strategi
keseimbangan oleh John von Neumann.
Kemudian ide Von Neumann ini
digunakan sebagai landasan teorema Brouwer
yang menjadi metode standar dalam teori permainan dan ekonomi matematika.
Makalahnya diikuti dengan dikeluarkannya buku tentang Teori Permainan dan
Perilaku Ekonomi pada tahun 1944, dengan Oskar
Morgenstern, yang dianggap permainan kooperasi dari beberapa pemain. Edisi
kedua dari buku ini memberikan teori aksiomatis dari utilitas yang diharapkan,
yang memungkinkan ahli statistik matematika dan ekonom untuk mengobati
pengambilan keputusan di bawah ketidakpastian.
Pada tahun 1950,
pembahasan pertama dari dilema narapidana muncul, dan percobaan
dilakukan pada teori permainan ini di perusahaan RAND.
Sekitar waktu yang sama, John Nash mengembangkan
kriteria untuk konsistensi saling strategi pemain, yang dikenal sebagai
kesetimbangan Nash, berlaku untuk
lebih banyak jenis permainan dari kriteria yang diusulkan oleh Von Neumann dan Morgenstern.
Keseimbangan ini cukup umum untuk memungkinkan
analisis permainan non-kooperatif di samping yang kooperatif.
Teori permainan mengalami
perkembangan yang pesat pada tahun 1950, selama periode ini, konsep-konsep inti, permainan
bentuk yang luas, bermain fiktif,
permainan berulang, dan nilai Shapley dikembangkan.
Selain itu, aplikasi pertama dari teori permainan ke filsafat dan ilmu politik terjadi dalam periode ini. Pada tahun 1965, Reinhard Selten memperkenalkan konsep solusi dari kesetimbangan subgame sempurna, yang merupakan pengembangan dari kesetimbangan Nash. Pada tahun 1967, John Harsanyi mengembangkan konsep
informasi yang lengkap dan permainan Bayes.
Nash, Selten dan Harsanyi menjadi
pemenang hadiah Nobel Ekonomi pada tahun 1994 atas kontribusi mereka pada teori
permainan ekonomi.
Pada 1970-an, teori permainan secara
luas diterapkan dalam biologi, sebagian besar sebagai hasil karya John Maynard Smith dan strateginya
evolusi stabil (yang dianugerahi Penghargaan Crafoord ). Pada tahun 2005, teori
permainanThomas Schelling dan Robert Aumann mengikuti Nash, Selten dan Harsanyi sebagai pemenang hadiah Nobel. Schelling bekerja pada model dinamis, contoh-contoh awal dari teori
permainan evolusi. Aumann memberikan
kontribusi keseimbangan sekolah, memperkenalkan keseimbangan pengkasaran,
keseimbangan berkorelasi, dan mengembangkan analisis formal yang tinggi dari
asumsi pengetahuan umum dan konsekuensinya. Lalu pada tahun 2007, Leonid Hurwicz, bersama dengan Eric Maskin dan Roger Myerson, dianugerahi Hadiah Nobel di bidang Ekonomi karena
telah meletakkan dasar-dasar teori mekanisme .
A. Pengertian Game
Theory / Teori Permainan
Menurut John von Neumann dan Oskar
Morgenstern permainan terdiri atas sekumpulan peraturan yang membangun
situasi bersaing dari dua sampai beberapa orang atau kelompok dengan memilih
strategi yang dibangun untuk memaksimalkan kemenangan sendiri atau pun untuk
meminimalkan kemenangan lawan. Peraturan- peraturan menentukan kemungkinan
tindakan untuk setiap pemain, sejumlah keterangan diterima setiap pemain
sebagai kemajuan bermain, dan sejumlah kemenangan atau kekalahan dalam berbagai
situasi.
Sedangkan Kartono menjelaskan bahwa teori permainan (Game Theory) merupakan teori yang menggunakan
pendekatan matematis dalam merumuskan
situasi persaingan dan konflik antara berbagai
kepentingan. Teori ini dikembangkan untk menganalisa proses pengambilan keputusan yaitu strategi optimum dari
situasi-situasi persaingan yang
berbeda-beda dan melibatkan dua atau
lebih kepentingan.
Secara umum teori permainan dapat didefinisikan sebagai sebuah pendekatan terhadap kemungkinan strategi yang akan dipakai, yang disusun secara matematis agar bisa diterima secara logis dan rasional. Serta digunakan untuk mencari strategi terbaik dalam suatu aktivitas, dimana setiap pemain didalamnya sama- sama mencapai utilitas tertinggi.
Ide dasar dari teori permainan dalah
tingkah laku strategis dari pemain atau pengambil keputusan. Setiap pemain
diasumsikan mempunyai suatu seri rencana atau model tingkah laku dari mana
pemain dapat memilih, jika memilih suatu himpunan strategi. Permainan diartikan
sebagai gerakan khusus yang harus dipilih dari himpunan strategi yang ada.
Anggapannya bahwa setiap pemain mempunyai kemampuan untuk mengambil keputusan
secara bebas dan rasional.
Teori ini menyediakan suatu bahasa
untuk memformulasikan, menstrukturkan, menganalisa dan mengerti
skenario strategi serta digunakan untuk pemilihan strategi. Langkah pertama dalam menggunakan teori permainan adalah menentukan secara eksplisit pemain,
strategi-strategi yang ada
dan juga menentukan preferensi serta
reaksi dari setiap pemain.
B. Ketentuan Umum Dan Model Teori Permainan
Ketentuan
umum dari teori permainan adalah :
1)
Setiap pemain bermain rasional,
dengan asumsi memiliki intelegensi yang sama, dan tujuan sama, yaitu
memaksimumkan payoff, dengan kriteria maksimin dan minimaks.
2)
Minimal terdiri dari 2 pemain,
keuntungan bagi salah satu pemain merupakan kerugian bagi pemain lain.
3)
Tabel yang disusun menunjukkan
keuntungan pemain baris, dan kerugian pemain kolom.
4)
Permainan dikatakan adil jika hasil
akhir menghasilkan nilai nol (0), tidak ada yang
menang/kalah.
5)
Tujuan dari teori permainan ini
adalah mengidentifikasi strategi yang paling
optimal
Model teori permainan dapat
diklasifikasikan dengan sejumlah cara seperti jumlah pemain, jumlah keuntungan
dan kerugian serta jumlah strategi yang digunakan dalam permainan. Contoh bila
jumlah pemain adalah dua, pemain disebut sebagai permainan dua-pemain. Jika
jumlah keuntungan dan kerugian adalah nol, disebut permainan jumlah nol
(zero-sum game) atau jumlah konstan. Sebaliknya bila tidak sama dengan nol,
permainan disebut permainan bukan jumlah nol (non zero – sum game).
C. Unsur-Unsur Dalam Teori Permainan
Berikut ini akan diuraikan beberapa
unsur atau elemen dasar yang penting dalam penyelesaian dari setiap kasus
dengan teori permainan dengan mengambil permainan dua pemain jumlah nol.
Tabel Permainan Dua Pemain Jumlah Nol
Pemain
A
|
Pemain
B
|
||
B1
|
B2
|
B3
|
|
A1
|
1
|
9
|
2
|
A2
|
8
|
5
|
4
|
Dari tabel
diatas dapat diuraikan unsur-unsur dasar teori permainan :
1.
Angka-angka dalam matriks payoff,
atau biasa disebut matriks permainan, menunjukkan hasil-hasil dari
strategi-strategi permainan yang berbeda-beda.
Hasil-hasil ini dinyatakan dalam suatu bentuk ukutan efektivitas,
seperti uang, persentase market share. Dalam permainan dua pemain jumlah nol, bilangan-bilangan positif menunjukkan keuntungan bagi pemain
baris (maximizing player), dan merupakan kerugian bagi pemain kolom (maximizing
player). Sebagai contoh, bila pemain
A mempergunakan strategi A1 dan pemain B memilih strategi B2
, maka hasilnya A
memperoleh keuntungan 9 dan B kerugian
9. Anggapannya bahwa matriks payoff diketahui
oleh kedua pemain.
2. Suatu
strategi permainan adalah rangkaian
kegiatan atau rencana yang menyeluruh dari seorang
pemain, sebagai reaksi atas aksi yang mungkin dilakukan oleh pemain lain yang
menjadi pesaingnya. Dalam hal ini dianggap bahwa suatu strategi tidak dapat
dirusak oleh para pesaing atau faktor lain.
Dalam tabel di atas pemain A mempunyai 2 strategi yaitu A1 dan A2 dan pemain B mempunyai 3 strategi yaitu
(B1, B2, B3
3. Aturan-aturan permainan menggambarkan kerangka dengan mana para pemain memilih strategi mereka. Sebagai contoh, dipakai
anggapan bahwa para pemain harus memilih strategi-strategi mereka secara
simultan dan bahwa permainan adalah berulang.
4. Nilai permainan adalah
hasil yang diperkirakan permainan atau payoff
rata-rata dari sepanjang rangkaian permainan, dimana kedua pemain mengikuti atau mempergunakan strategi mereka yang paling baik
atau optimal. Suatu permainan dikatakan
“adil” (fair)
apabila nilainya nol, dimana tak ada pemain yang
memperoleh keuntungan atau kemenangan. Permainan dikatakan “tidak adil” (unfair) apabila nilainya bukan nol.
5. Suatu
strategi dikatakan dominan bila
setiap payoff dalam strategi adalah superior terhadap
setiap payoff yang berhubungan dalam suatu strategi alternatif.. Nilai permainan adalah 4. Aturan
dominan ini dapat digunakan untuk
mengurangi ukuran
matriks payoff
dan upaya perhitungan.
6. Suatu strategi optimal adalah rangkaian kegiatan,
atau rencana yang menyeluruh,
yang menyebabkan seorang pemain dalam posisi yang paling menguntungkan tanpa memperhatikan
kegiatan-kegiatan para
pesaingnya. Peng
ert ia n po s is i
me
ngu nt ungka n ad a la h ba hw a ada nya d e vis i
(penyimpangan) dari strategi optimal, atau rencana optimal,
akan menurunkan payoff.
7.
Tujuan dari model
permainan adalah mengindentifikasikan stratagi atau rencana optimal untuk setiap
pemain. Dari contoh diatas, strategi optimal
untuk A adalah A2, dan B3
adalah
strategi optimal untuk B.
D. Strategi Dalam Teori Permainan
Permainan Strategi Murni (Pure-Strategy Game)
Beserta Contoh Kasus
Dalam permainan strategi murni,
strategi optimal untuk setiap pemain adalah dengan menggunakan strategi
tunggal. Pemain baris mengidentifikasikan strategi optimalnya melalui aplikasi
kriteria maksimin(maximin) dan pemain kolom dengan kriteria minimaks (minimax).
Nilai yang dicapai harus merupakan maksimum dari minimaks baris dan minimum
dari maksimin kolom, titik ini dikenal sebagai titik pelana (saddle point).
Bila nilai minimaks tidak sama dengan
nilai maksimin maka permainan tidak dapat dipecahkan dengan strategi murni
harus menggunakan strategi campuran.
Langkah-langkah
penyelesaian:
1.
Carilah nilai minimum baris dan maksimum kolom.
2.
Dari nilai-nilai minimum setiap
baris cari nilai maksimalnya atau disebut nilai maksimin. Sedangkan dari nilai
maksimum kolom tentukan satu nilai minimal sebagai nilai minimaks.
3.
Bila nilai minimaks sama dengan
nilai maksimin, berarti strategi yang paling
optimal untuk masing-masing pemain telah ditemukan.
Dari contoh soal
(dari table sebelumnya), penyelesaian teori permainannya adalah seperti tabel
berikut:
Pemain A
|
Pemain
B
|
Minimum Baris
|
||
B1
|
B2
|
B3
|
||
A1
|
1
|
9
|
2
|
1
|
A2
|
6
|
5
|
(4)
|
4*(maks)
|
Maksimum
kolom
|
6
|
9
|
4*(min)
|
|
Dari hasil tabel diatas nilai
maksimin dan minimaks sama, sehingga strategi yang optimal untuk A adalah
strategi A2 (baris dimana terdapat nilai maksimin) dan untuk B adalah strategi
B3 (strategi dimana terdapat nilai minimaks).
Permainan Strategi Campuran (Mixed-Strategy Game) Beserta Contoh Kasus
Seperti dikatakan sebelumnya bahwa bila nilai
maksimin dan minimaks tidak sama.
Penyelesaian soal adalah dengan strategi campuran. Untuk memperjelas penjelasan
strategi ini digunakan contoh berikut:
Pemain A
|
Pemain B
|
Minimum Baris
|
||
B1
|
B2
|
B3
|
||
A1
|
2
|
5
|
7
|
2*(maks)
|
A2
|
-1
|
2
|
4
|
-1
|
A3
|
6
|
1
|
9
|
1
|
Maksimum kolom
|
6
|
5*(min)
|
9
|
|
Dari tabel diatas diketahui bahwa
nilai maksimin tidak sama dengan nilai minimaks. Dengan menerapkan aturan
dominan maka strategi B3 didominasi oleh strategi B2 sehingga kolom B3
dihapuskan. Demikian juga strategi A2 didominasi oleh strategi A1 sehingga baris
A2 dihilangkan. Matriks permainan berubah menjadi seperti berikut :
Pemain A
|
Pemain B
|
Minimum Baris
|
|
B1
|
B2
|
||
A1
|
2
|
5
|
2
|
A2
|
6
|
1
|
1
|
Maksimum Kolom
|
6
|
5
|
|
Karena nilai maksimin tetap tidak
sama dengan nilai minimaks maka penyelesaian permainan strategi ini dapat
dilakukan dengan menggunakan metode grafik, metode aljabar matriks, metode
analitis atau linear programming. Dibawah ini hanya akan
dijelaskan mengenai metode analitis dan linier programming.
· Metode Analitis
Dalam pola ini kita menentukan suatu distribusi
probabilitas untuk strategi-strategi yang berbeda. Nilai-nilai probabilitas pay
off dapat dihitung dengan cara berikut:
* Untuk pemain A
Anggap bahwa digunakan strategi A1 dengan probabilitas
P, dan untuk strategi A3 probabilitasnya 1-p. Jika strategi yang digunakan oleh
B adalah B1 maka keuntungan yang diharapkan A adalah:
2p + 6(1 -P) = 6 - 4p
Bila B menggunakan strategi B2, maka keuntungan yang
diharapkan A adalah: 5p + 1(1 - p) = 1 + 4p
Strategi optimal untuk A diperoleh dengan menyamakan
kedua payoff yang diharapkan, sehingga diperolehnya:
6 - 4p = 1 + 4p p = 0,625
Ini berarti pemain A harus menggunakan strategi A1 62,5%
dan strategi A3 37,5%. Keuntungan yang diharapkan pemain A :
= 0,625 ( 2 )
+ 0,375 ( 6 )
= 0,625 ( 5 )
+ 0,375 ( 1 )
= 3,5
* Untuk pemain B
Dengan cara yang sama dapat dihitung pay off yang
diharapkan untuk pemain B. Probabilitas untuk strategi B1 adalah q dan B2
adalah 1 - q.
maka :
Kerugian B, jika A menggunakan strategi A1 adalah : 2q +
5 (1 - q) = 5 - 3q
Kerugian B, jika A menggunakan strategi A3 adalah : 6q +
1 (1 - q) = 1 + 5q
Strategi optimal untuk pemain B adalah :
5 - 3q = 1 +
5q
q = 0,50
Hasil ini berarti pemain B seharusnya menggunakan strategi B1 50%
dan strategi B2. Kerugian yang diharapkan untuk pemain B:
= 0,50 ( 2 ) + 0,50 ( 5 )
= 0,50 ( 6 ) +
0,50 ( 1 )
= 3,5
· Metode Linear Programming
Metode sebelumnya dalam penggunaan mempunyai ruang
lingkup terbatas. Untuk menyelesaikan permainan strategi campuran 3 x 3 atau
dimensi yang lebih besar dapat digunakan metode linier programming.
Untuk menerangkan teknik ini digunakan contoh permainan
dua pemain jumlah nol dalam tabel di atas. Notasi yang digunakan :
V =
nilai permainan
X1 dan X2 = probabilitas pemilihan strategi A1 dan strategi A3 Y1 dan Y2 = probabilitas pemilihan strategi B1 dan
strategi B2
Dengan A sebagai maximizing player maka keuntungan yang diharapkan oleh A dalam tanda ketidaksamaan >. Dengan
demikian nilai keuntungan yang diharapkan untuk pemain A adalah :
2X1 + 6X2 ³ V (bila pemain B menggunakan strategi B1 seterusnya) 5X1 + 1X2 ³ V (bila pemain
B menggunakan strategi B2 seterusnya)
Diketahui bahwa
:
X1 + X2 = 1 DAN
X1 , X2 ³ 0
Dengan B sebagai
minimazing player maka dapat
dinyatakan kerugian yang diharapkan oleh B dalam tanda ketidaksamaan ò.
Dengan demikian nilai kerugian yang diharapkan untuk
pemain B adalah : 2Y1 + 5Y2 £ V (bila pemain A menggunakan strategi A1 seterusnya) 6Y1 + 1Y2 £ V (bila pemain
A menggunakan strategi A3 seteturnya)
Diketahui bahwa
:
Y1 + Y2 = 1 DAN
Y1 , Y2 £ 0
Dengan membagi
setiap ketidaksamaan dan persamaan diatas dengan V diperoleh :
* Untuk pemain A: * Untuk pemain B:
2X1 + 6X2 ³ 1 2Y1 + 6X2 £ 1
5X1 + 1X2 ³ 1 5Y1 + 1Y2 £ 1
X1 + X2 = 1/V Y1
+ Y2 = 1/V
Kemudian dari masalah diatas diselesaikan dengan linear programming.
Rumusan masalah linear programming untuk A adalah :
Min : X1+
X2
Batasan-batasan : 2X1
+ 6X2 ³ 1
5X1 + 1X2 ³ 1 X1 , X2 ³ 0
Rumusan masalah linear programming
untuk B adalah : Maks : Y1 + Y2
Batasan-batasan : 2Y1 + 5Y2 £
1
6Y1 + 1Y2 £ 1 Y1 , Y2 £ 0
Dengan
menggunakan metode simpleks,
nilai permainannya (V)
diketahui sebesar 3,5. Dari hasil nilai permainan ini selanjutnya dapat
dicari nilai probabilitas dari pemilihan masing-masing strategi sebagai berikut :
X1 = V . X1 Y1 = V . Y1
X2 = V . X2 Y2
= V . Y2
P7.2 Contoh Kasus
Dua
buah perusahaan yang kegiatannya memproduksi dan menjual produk sedang bersaing
dalam menerapkan strategi periklanan perusahaannya. Perusahaan A dan B,
masing-masing mempunyai tiga alternatif strategi. Jumlah konsumen yang dapat
ditarik dalam berbagai alternatif dapat dilihat dari tabel berikut:
Strategi
|
B1
|
B2
|
B3
|
A1
|
3.000
|
1900
|
2.500
|
A2
|
2.000
|
1.500
|
1.700
|
A3
|
2.100
|
2.200
|
1.800
|
Dengan menggunakan teori permainan, apakah kedua
perusahaan menggunakan strategi murni atau campuran. Sebutkan strategi yang
digunakan kedua perusahaan dan berapa nilai permainannya.
Sumber : Z. Edhar Ahadi,
https://www.academia.edu/4567775/GAME_THEORY_TEORI_PERMAINAN_Objektif_Pemain_A_Pemain_BPemain_A_Pemain_BPemain_A_Pemain_B
Comments
Post a Comment