GAME THEORY (TEORI PERMAINAN)


Sejarah teori permainan dimulai dari diskusi awal contoh permainan dua orang yang terjadi jauh sebelum munculnya teori permainan matematika modern. Pembahasan pertama yang diketahui dari teori permainan terjadi dalam surat yang ditulis oleh James Waldegrave pada tahun 1713. Lalu seorang ahli matematika Perancis yang bernama Emile Borel pada tahun 1921 membuktikan teorema minimax untuk dua orang zero-sum game matriks hanya jika matriks pay-off adalah simetris.
Namun yang paling terkenal adalah teori permainan modern yang dimulai dengan ide tentang adanya campuran strategi keseimbangan oleh John von Neumann. Kemudian ide Von Neumann ini digunakan sebagai landasan teorema Brouwer yang menjadi metode standar dalam teori permainan dan ekonomi matematika. Makalahnya diikuti dengan dikeluarkannya buku tentang Teori Permainan dan Perilaku Ekonomi pada tahun 1944, dengan Oskar Morgenstern, yang dianggap permainan kooperasi dari beberapa pemain. Edisi kedua dari buku ini memberikan teori aksiomatis dari utilitas yang diharapkan, yang memungkinkan ahli statistik matematika dan ekonom untuk mengobati pengambilan keputusan di bawah ketidakpastian.
Pada tahun 1950, pembahasan pertama dari dilema narapidana muncul, dan percobaan

dilakukan pada teori permainan ini di perusahaan RAND. Sekitar waktu yang sama, John Nash mengembangkan kriteria untuk konsistensi saling strategi pemain, yang dikenal sebagai kesetimbangan Nash, berlaku untuk lebih banyak jenis permainan dari kriteria yang diusulkan oleh Von Neumann dan Morgenstern. Keseimbangan ini cukup umum untuk memungkinkan analisis permainan non-kooperatif di samping yang kooperatif.
Teori permainan mengalami perkembangan yang pesat pada tahun 1950, selama periode ini, konsep-konsep inti, permainan bentuk yang luas, bermain fiktif, permainan berulang, dan nilai Shapley dikembangkan. Selain itu, aplikasi pertama dari teori permainan ke filsafat dan ilmu politik terjadi dalam periode ini. Pada tahun 1965, Reinhard Selten memperkenalkan konsep solusi dari kesetimbangan subgame sempurna, yang merupakan pengembangan dari kesetimbangan Nash. Pada tahun 1967, John Harsanyi mengembangkan konsep informasi yang lengkap dan permainan Bayes. Nash, Selten dan Harsanyi menjadi pemenang hadiah Nobel Ekonomi pada tahun 1994 atas kontribusi mereka pada teori permainan ekonomi.
Pada 1970-an, teori permainan secara luas diterapkan dalam biologi, sebagian besar sebagai hasil karya John Maynard Smith dan strateginya evolusi stabil (yang dianugerahi Penghargaan Crafoord ). Pada tahun 2005, teori permainanThomas Schelling dan Robert Aumann mengikuti Nash, Selten dan Harsanyi sebagai pemenang hadiah Nobel. Schelling bekerja pada model dinamis, contoh-contoh awal dari teori permainan evolusi. Aumann memberikan kontribusi keseimbangan sekolah, memperkenalkan keseimbangan pengkasaran, keseimbangan berkorelasi, dan mengembangkan analisis formal yang tinggi dari asumsi pengetahuan umum dan konsekuensinya. Lalu pada tahun 2007, Leonid Hurwicz, bersama dengan Eric Maskin dan Roger Myerson, dianugerahi Hadiah Nobel di bidang Ekonomi karena telah meletakkan dasar-dasar teori mekanisme .

A.     Pengertian Game Theory / Teori Permainan

Menurut John von Neumann dan Oskar Morgenstern permainan terdiri atas sekumpulan peraturan yang membangun situasi bersaing dari dua sampai beberapa orang atau kelompok dengan memilih strategi yang dibangun untuk memaksimalkan kemenangan sendiri atau pun untuk meminimalkan kemenangan lawan. Peraturan- peraturan menentukan kemungkinan tindakan untuk setiap pemain, sejumlah keterangan diterima setiap pemain sebagai kemajuan bermain, dan sejumlah kemenangan atau kekalahan dalam berbagai situasi.
Sedangkan Kartono menjelaskan bahwa teori permainan  (Game Theory) merupakan teori yang menggunakan pendekatan matematis dalam merumuskan situasi persaingan dan konflik antara berbagai kepentingan. Teori ini dikembangkan untk menganalisa proses pengambilan keputusan yaitu strategi optimum dari situasi-situasi persaingan yang berbeda-beda dan melibatkan dua atau lebih kepentingan.

Secara umum teori permainan dapat didefinisikan sebagai sebuah pendekatan terhadap kemungkinan strategi yang akan dipakai, yang disusun secara matematis agar bisa diterima secara logis dan rasional. Serta digunakan untuk mencari strategi terbaik dalam suatu aktivitas, dimana setiap pemain didalamnya sama- sama mencapai utilitas tertinggi.

Ide dasar dari teori permainan dalah tingkah laku strategis dari pemain atau pengambil keputusan. Setiap pemain diasumsikan mempunyai suatu seri rencana atau model tingkah laku dari mana pemain dapat memilih, jika memilih suatu himpunan strategi. Permainan diartikan sebagai gerakan khusus yang harus dipilih dari himpunan strategi yang ada. Anggapannya bahwa setiap pemain mempunyai kemampuan untuk mengambil keputusan secara bebas dan rasional.
Teori ini menyediakan suatu bahasa untuk memformulasikan, menstrukturkan, menganalisa dan mengerti skenario strategi serta digunakan untuk pemilihan strategi. Langkah pertama dalam menggunakan teori permainan adalah menentukan secara eksplisit pemain, strategi-strategi yang ada dan juga menentukan preferensi serta reaksi dari setiap pemain.

B.      Ketentuan Umum Dan Model Teori Permainan


Ketentuan umum dari teori permainan adalah :
1)     Setiap pemain bermain rasional, dengan asumsi memiliki intelegensi yang sama, dan tujuan sama, yaitu memaksimumkan payoff, dengan kriteria maksimin dan minimaks.
2)     Minimal terdiri dari 2 pemain, keuntungan bagi salah satu pemain merupakan kerugian bagi pemain lain.
3)     Tabel yang disusun menunjukkan keuntungan pemain baris, dan kerugian pemain kolom.
4)     Permainan dikatakan adil jika hasil akhir menghasilkan nilai nol (0), tidak ada yang menang/kalah.
5)     Tujuan dari teori permainan ini adalah mengidentifikasi strategi yang paling optimal
Model teori permainan dapat diklasifikasikan dengan sejumlah cara seperti jumlah pemain, jumlah keuntungan dan kerugian serta jumlah strategi yang digunakan dalam permainan. Contoh bila jumlah pemain adalah dua, pemain disebut sebagai permainan dua-pemain. Jika jumlah keuntungan dan kerugian adalah nol, disebut permainan jumlah nol (zero-sum game) atau jumlah konstan. Sebaliknya bila tidak sama dengan nol, permainan disebut permainan bukan jumlah nol (non zero – sum game).

C.     Unsur-Unsur Dalam Teori Permainan


Berikut ini akan diuraikan beberapa unsur atau elemen dasar yang penting dalam penyelesaian dari setiap kasus dengan teori permainan dengan mengambil permainan dua pemain jumlah nol.

Tabel Permainan Dua Pemain Jumlah Nol

Pemain
A
Pemain B
B1
B2
B3
A1
1
9
2
A2
8
5
4

Dari tabel diatas dapat diuraikan unsur-unsur dasar teori permainan :

1.  Angka-angka dalam matriks payoff, atau biasa disebut matriks permainan, menunjukkan hasil-hasil dari strategi-strategi permainan yang berbeda-beda. Hasil-hasil ini dinyatakan dalam suatu bentuk ukutan efektivitas, seperti uang, persentase market share. Dalam permainan dua pemain jumlah nol, bilangan-bilangan positif menunjukkan keuntungan bagi pemain baris (maximizing player), dan merupakan kerugian bagi pemain kolom (maximizing player). Sebagai contoh, bila pemain A mempergunakan strategi A1 dan pemain B memilih strategi B2 , maka hasilnya A memperoleh  keuntungan 9 dan B kerugian 9. Anggapannya bahwa matriks payoff diketahui oleh kedua pemain.
2.  Suatu strategi permainan adalah rangkaian kegiatan atau rencana yang menyeluruh dari seorang pemain, sebagai reaksi atas aksi yang mungkin dilakukan oleh pemain lain yang menjadi pesaingnya. Dalam hal ini dianggap bahwa suatu strategi tidak dapat dirusak oleh para pesaing atau faktor lain. Dalam tabel di atas pemain A mempunyai 2 strategi yaitu A1 dan A2 dan pemain B mempunyai 3 strategi yaitu (B1, B2, B3
3.  Aturan-aturan permainan menggambarkan kerangka dengan mana para pemain memilih strategi mereka. Sebagai contoh, dipakai anggapan bahwa para pemain harus memilih strategi-strategi mereka secara simultan dan bahwa permainan adalah berulang.
4.  Nilai permainan adalah hasil yang diperkirakan permainan atau payoff rata-rata dari sepanjang rangkaian permainan, dimana kedua pemain mengikuti atau mempergunakan strategi mereka yang paling baik atau optimal. Suatu permainan dikatakan “adil” (fair) apabila nilainya nol, dimana tak ada pemain yang memperoleh keuntungan atau kemenangan. Permainan dikatakan “tidak adil” (unfair) apabila nilainya bukan nol.
5.  Suatu strategi dikatakan dominan bila setiap payoff dalam strategi adalah superior terhadap setiap payoff yang berhubungan dalam suatu strategi alternatif.. Nilai permainan adalah 4. Aturan dominan ini dapat digunakan untuk mengurangi ukuran

matriks payoff dan upaya perhitungan.
6.  Suatu strategi optimal adalah rangkaian kegiatan, atau rencana yang menyeluruh, yang menyebabkan seorang pemain dalam posisi yang paling menguntungkan tanpa memperhatikan     kegiatan-kegiatan     para     pesaingnya.    Peng ert ia n  po s is i me ngu nt ungka n ad a la h ba hw a ada nya d e vis i  (penyimpangan) dari strategi optimal, atau rencana optimal, akan menurunkan payoff.
7.  Tujuan dari model permainan adalah mengindentifikasikan stratagi atau rencana optimal untuk setiap pemain. Dari contoh diatas, strategi optimal untuk A  adalah A2, dan B3 adalah strategi optimal untuk B.

D.     Strategi Dalam Teori Permainan

Permainan Strategi Murni (Pure-Strategy Game) Beserta Contoh Kasus
Dalam permainan strategi murni, strategi optimal untuk setiap pemain adalah dengan menggunakan strategi tunggal. Pemain baris mengidentifikasikan strategi optimalnya melalui aplikasi kriteria maksimin(maximin) dan pemain kolom dengan kriteria minimaks (minimax). Nilai yang dicapai harus merupakan maksimum dari minimaks baris dan minimum dari maksimin kolom, titik ini dikenal sebagai titik pelana (saddle point).
Bila nilai minimaks tidak sama dengan nilai maksimin maka permainan tidak dapat dipecahkan dengan strategi murni harus menggunakan strategi campuran.
Langkah-langkah penyelesaian:
1.                 Carilah nilai minimum baris dan maksimum kolom.
2.                 Dari nilai-nilai minimum setiap baris cari nilai maksimalnya atau disebut nilai maksimin. Sedangkan dari nilai maksimum kolom tentukan satu nilai minimal sebagai nilai minimaks.
3.                 Bila nilai minimaks sama dengan nilai maksimin, berarti strategi yang paling optimal untuk masing-masing pemain telah ditemukan.

Dari contoh soal (dari table sebelumnya), penyelesaian teori permainannya adalah seperti tabel berikut:
Pemain A
Pemain B
Minimum Baris
B1
B2
B3
A1
1
9
2
1
A2
6
5
(4)
4*(maks)
Maksimum
kolom
6
9
4*(min)


Dari hasil tabel diatas nilai maksimin dan minimaks sama, sehingga strategi yang optimal untuk A adalah strategi A2 (baris dimana terdapat nilai maksimin) dan untuk B adalah strategi B3 (strategi dimana terdapat nilai minimaks).

Permainan Strategi Campuran (Mixed-Strategy Game) Beserta Contoh Kasus

Seperti dikatakan sebelumnya bahwa bila nilai  maksimin  dan minimaks tidak sama. Penyelesaian soal adalah dengan strategi campuran. Untuk memperjelas penjelasan strategi ini digunakan contoh berikut:
Pemain A
Pemain B
Minimum Baris
B1
B2
B3
A1
2
5
7
2*(maks)
A2
-1
2
4
-1
A3
6
1
9
1
Maksimum kolom
6
5*(min)
9


Dari tabel diatas diketahui bahwa nilai maksimin tidak sama dengan nilai minimaks. Dengan menerapkan aturan dominan maka strategi B3 didominasi oleh strategi B2 sehingga kolom B3 dihapuskan. Demikian juga strategi A2 didominasi oleh strategi A1 sehingga baris A2 dihilangkan. Matriks permainan berubah menjadi seperti berikut :

Pemain A
Pemain B
Minimum Baris
B1
B2
A1
2
5
2
A2
6
1
1
Maksimum Kolom
6
5


Karena nilai maksimin tetap tidak sama dengan nilai minimaks maka penyelesaian permainan strategi ini dapat dilakukan dengan menggunakan metode grafik, metode aljabar matriks, metode analitis  atau  linear programming. Dibawah ini hanya akan dijelaskan mengenai metode analitis dan linier programming.

·   Metode Analitis

Dalam pola ini kita menentukan suatu distribusi probabilitas untuk strategi-strategi yang berbeda. Nilai-nilai probabilitas pay off dapat dihitung dengan cara berikut:

* Untuk pemain A

Anggap bahwa digunakan strategi A1 dengan probabilitas P, dan untuk strategi A3 probabilitasnya 1-p. Jika strategi yang digunakan oleh B adalah B1 maka keuntungan yang diharapkan A adalah:
2p + 6(1 -P) = 6 - 4p
Bila B menggunakan strategi B2, maka keuntungan yang diharapkan A adalah: 5p + 1(1 - p) = 1 + 4p
Strategi optimal untuk A diperoleh dengan menyamakan kedua payoff yang diharapkan, sehingga diperolehnya:
6 - 4p = 1 + 4p p = 0,625
Ini berarti pemain A harus menggunakan strategi A1 62,5% dan strategi A3 37,5%. Keuntungan yang diharapkan pemain A :
= 0,625 ( 2 ) + 0,375 ( 6 )
= 0,625 ( 5 ) + 0,375 ( 1 )

= 3,5


* Untuk pemain B

Dengan cara yang sama dapat dihitung pay off yang diharapkan untuk pemain B. Probabilitas untuk strategi B1 adalah q dan B2 adalah 1 - q.
maka :
Kerugian B, jika A menggunakan strategi A1 adalah : 2q + 5 (1 - q) = 5 - 3q
Kerugian B, jika A menggunakan strategi A3 adalah : 6q + 1 (1 - q) = 1 + 5q
Strategi optimal untuk pemain B adalah :
5 - 3q = 1 + 5q
q = 0,50
Hasil ini berarti pemain B seharusnya menggunakan strategi B1 50% dan strategi B2. Kerugian yang diharapkan untuk pemain B:
= 0,50 ( 2 ) + 0,50 ( 5 )
= 0,50 ( 6 ) + 0,50 ( 1 )

= 3,5




·   Metode Linear Programming
Metode sebelumnya dalam penggunaan mempunyai ruang lingkup terbatas. Untuk menyelesaikan permainan strategi campuran 3 x 3 atau dimensi yang lebih besar dapat digunakan metode linier programming.
Untuk menerangkan teknik ini digunakan contoh permainan dua pemain jumlah nol dalam tabel di atas. Notasi yang digunakan :
V                     = nilai permainan
X1 dan X2      = probabilitas pemilihan strategi A1 dan strategi A3 Y1 dan Y2    = probabilitas pemilihan strategi B1 dan strategi B2
Dengan A sebagai maximizing player maka keuntungan yang diharapkan oleh A dalam tanda ketidaksamaan >. Dengan demikian nilai keuntungan yang diharapkan untuk pemain A adalah :
2X1 + 6X2 ³ V (bila pemain B menggunakan strategi B1 seterusnya) 5X1 + 1X2 ³ V (bila pemain B menggunakan strategi B2 seterusnya)

Diketahui bahwa :
X1 + X2 = 1 DAN X1 , X2 ³ 0
Dengan B sebagai minimazing player maka dapat dinyatakan kerugian yang diharapkan oleh B dalam tanda ketidaksamaan                                                           ò.
Dengan demikian nilai kerugian yang diharapkan untuk pemain B adalah : 2Y1 + 5Y2 £ V (bila pemain A menggunakan strategi A1 seterusnya) 6Y1 + 1Y2 £ V (bila pemain A menggunakan strategi A3 seteturnya)
Diketahui bahwa :
Y1 + Y2 = 1 DAN Y1 , Y2 £ 0
Dengan membagi setiap ketidaksamaan dan persamaan diatas dengan V diperoleh :

* Untuk pemain A:                               * Untuk pemain B:

2X1 + 6X2  ³ 1                                   2Y1 + 6X2   £ 1
5X1 + 1X2  ³ 1                                   5Y1 + 1Y2   £ 1
X1 +  X2 = 1/V                                   Y1 + Y2 = 1/V
Kemudian dari masalah diatas diselesaikan dengan linear programming. Rumusan masalah linear programming untuk A adalah :
Min                              : X1+ X2
Batasan-batasan          : 2X1 + 6X2 ³ 1
5X1 + 1X2 ³ 1 X1 , X2 ³ 0
Rumusan masalah linear programming untuk B adalah : Maks         : Y1 + Y2
Batasan-batasan          : 2Y1 + 5Y2 £ 1
6Y1 + 1Y2 £ 1 Y1 ,  Y2    £ 0
Dengan  menggunakan  metode  simpleks,  nilai  permainannya  (V)  diketahui sebesar 3,5. Dari hasil nilai permainan ini selanjutnya dapat dicari nilai probabilitas dari pemilihan masing-masing strategi sebagai berikut :

X1 = V . X1                   Y1 = V . Y1

X2 = V . X2                   Y2 = V . Y2



P7.2 Contoh Kasus
Dua buah perusahaan yang kegiatannya memproduksi dan menjual produk sedang bersaing dalam menerapkan strategi periklanan perusahaannya. Perusahaan A dan B, masing-masing mempunyai tiga alternatif strategi. Jumlah konsumen yang dapat ditarik dalam berbagai alternatif dapat dilihat dari tabel berikut:
Strategi
B1
B2
B3
A1
3.000
1900
2.500
A2
2.000
1.500
1.700
A3
2.100
2.200
1.800
Dengan menggunakan teori permainan, apakah kedua perusahaan menggunakan strategi murni atau campuran. Sebutkan strategi yang digunakan kedua perusahaan dan berapa nilai permainannya.

Sumber :  Z. Edhar Ahadi,
https://www.academia.edu/4567775/GAME_THEORY_TEORI_PERMAINAN_Objektif_Pemain_A_Pemain_BPemain_A_Pemain_BPemain_A_Pemain_B

Comments

Popular Posts