Command STATA yg sering dipakai
1. Regresi OLS
Misalnya: reg KREDIT PENDAPU TDIDIK FISET TAB EXP
. reg KREDIT PENDAPU TDIDIK FISET TAB EXP
Source SS df MS Number of obs = 2092
F( 5, 2086) = 132.31
Model 1.8575e+18 5 3.7150e+17 Prob > F = 0.0000
Residual 5.8571e+18 2086 2.8078e+15 R-squared = 0.2408
Adj R-squared = 0.2390
Total 7.7146e+18 2091 3.6894e+15 Root MSE = 5.3e+07
KREDIT Coef. Std. Err. t P>|t| [95% Conf. Interval]
PENDAPU .1539258 .0346861 4.44 0.000 .0859027 .2219488
TDIDIK 1174693 340250.3 3.45 0.001 507427.5 1841959
FISET .062418 .0079456 7.86 0.000 .0468358 .0780001
TAB .4123361 .0492451 8.37 0.000 .3157614 .5089107
EXP .1673312 .0147236 11.36 0.000 .1384567 .1962057
_cons -1.02e+07 3561678 -2.86 0.004 -1.72e+07 -3195617
Seandainya ingin meregresi data dengan PENDAPU kurang dari Rp 200jt, maka tambahkan if
PENDAPU < 200000000
reg KREDIT PENDAPU TDIDIK FISET TAB EXP if PENDAPU < 200000000
. reg KREDIT PENDAPU TDIDIK FISET TAB EXP if PENDAPU < 200000000
Source SS df MS Number of obs = 2079
F( 5, 2073) = 117.24
Model 1.6134e+18 5 3.2269e+17 Prob > F = 0.0000
Residual 5.7056e+18 2073 2.7524e+15 R-squared = 0.2204
Adj R-squared = 0.2186
Total 7.3191e+18 2078 3.5222e+15 Root MSE = 5.2e+07
KREDIT Coef. Std. Err. t P>|t| [95% Conf. Interval]
PENDAPU .3184316 .0486575 6.54 0.000 .223009 .4138542
TDIDIK 1059552 339494.2 3.12 0.002 393766.6 1725337
FISET .0651101 .008126 8.01 0.000 .049174 .0810462
TAB .3927725 .0500512 7.85 0.000 .2946166 .4909283
EXP .16608 .0150627 11.03 0.000 .1365403 .1956196
_cons -1.15e+07 3546400 -3.24 0.001 -1.84e+07 -4535162
2. Logit
Misalnya: logit DPARTIS PENDAPU TDIDIK UMUR PENGAL EXP I.DRISK I.DSKALA
I.DMILIK I.DSTATUS
. logit DPARTIS PENDAPU TDIDIK UMUR PENGAL EXP I.DRISK I.DSKALA I.DMILIK I.DSTATUS
Iteration 0: log likelihood = -2428.6225
Iteration 1: log likelihood = -2394.5583
Iteration 2: log likelihood = -2394.4405
Iteration 3: log likelihood = -2394.4404
Logistic regression Number of obs = 3659
LR chi2(8) = 68.36
Prob > chi2 = 0.0000
Log likelihood = -2394.4404 Pseudo R2 = 0.0141
DPARTIS Coef. Std. Err. z P>|z| [95% Conf. Interval]
PENDAPU -3.83e-10 9.78e-10 -0.39 0.695 -2.30e-09 1.53e-09
TDIDIK .0478412 .010168 4.71 0.000 .0279123 .06777
UMUR -.0065634 .0032903 -1.99 0.046 -.0130122 -.0001145
PENGAL -.0057812 .003932 -1.47 0.141 -.0134878 .0019255
EXP 7.62e-10 4.36e-10 1.75 0.081 -9.28e-11 1.62e-09
1.DRISK -.0549706 .0690433 -0.80 0.426 -.190293 .0803518
1.DSKALA .0808661 .173594 0.47 0.641 -.2593719 .4211041
1.DMILIK -.0161268 .206535 -0.08 0.938 -.4209279 .3886744
1.DSTATUS .3713614 .1272319 2.92 0.004 .1219915 .6207312
_cons -.9867249 .3006872 -3.28 0.001 -1.576061 -.3973887
3. Logit dengan menampilkan Odds Ratio, tambahkan option or dibelakang menjadi:
logit DPARTIS PENDAPU TDIDIK UMUR PENGAL EXP I.DRISK I.DSKALA
I.DMILIK I.DSTATUS, or
. logit DPARTIS PENDAPU TDIDIK UMUR PENGAL EXP I.DRISK I.DSKALA I.DMILIK I.DSTATUS,
> or
Iteration 0: log likelihood = -2428.6225
Iteration 1: log likelihood = -2394.5583
Iteration 2: log likelihood = -2394.4405
Iteration 3: log likelihood = -2394.4404
Logistic regression Number of obs = 3659
LR chi2(8) = 68.36
Prob > chi2 = 0.0000
Log likelihood = -2394.4404 Pseudo R2 = 0.0141
DPARTIS Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]
PENDAPU 1 9.78e-10 -0.39 0.695 1 1
TDIDIK 1.049004 .0106662 4.71 0.000 1.028306 1.070119
UMUR .9934581 .0032688 -1.99 0.046 .9870721 .9998855
PENGAL .9942355 .0039094 -1.47 0.141 .9866027 1.001927
EXP 1 4.36e-10 1.75 0.081 1 1
1.DRISK .946513 .0653504 -0.80 0.426 .8267169 1.083668
1.DSKALA 1.084226 .1882151 0.47 0.641 .771536 1.523643
1.DMILIK .9840026 .203231 -0.08 0.938 .6564374 1.475024
1.DSTATUS 1.449707 .1844489 2.92 0.004 1.129744 1.860288
_cons .3727956 .1120949 -3.28 0.001 .206788 .6720727
Interpretasi odds ratio: jika nilai odds ratio > 1, maka positif (meningkatkan peluang). Jika nilai odds
ratio < 1, maka negatif (mengurangi peluang).
Misalnya variable TDIDIK, dg odds ratio 1,049. Nilai ini lebih besar dari 1, artinya positif (dengan
kemungkinan bertambahnya peluang sebesar 1,049 - 1= 0,049 atau 4,9 persen.
Maka, utk variabel TDIDIK; jika pendidikan bertambah 1 tahun, maka peluang berpartisipasi kredit
(DPARTIS=1) akan meningkat sebesar 4,9 persen. Misalnya, seseorang dengan TDIDIK 9 tahun
memiliki peluang berpartisipasi sebesar 60 persen, maka orang yang memiliki TDIDIK 10 tahun akan
memiliki peluang berpartisipasi sebesar 64,9 persen (4,9 persen lebih tinggi dari yg TDIDIK-nya 9
tahun).
Utk variable UMUR, odds rationya 0,99345. Ini kurang dari satu, artinya negatif.
Maka jika UMUR bertambah satu tahun, peluang berpartisipasi akan berkurang sebesar 1 – 0,99345
= 0,00655 (0,655 persen)
Namun, Interpretasi odds ratio utk dummy variabel agak berbeda.
Misalnya utk variabel DSKALA (D=0 mikro, D=1 kecil) odds rationya adalah 1,084.
Interpretasinya; peluang usaha skala kecil utk ikut berpartisipasi adalah 1,084 kali dari usaha mikro.
4. margins, dydx (*)
. margins, dydx (*)
Average marginal effects Number of obs = 3659
Model VCE : OIM
Expression : Pr(DPARTIS), predict()
dy/dx w.r.t. : PENDAPU TDIDIK UMUR PENGAL EXP 1.DRISK 1.DSKALA 1.DMILIK 1.DSTATUS
Delta-method
dy/dx Std. Err. z P>|z| [95% Conf. Interval]
PENDAPU -8.85e-11 2.26e-10 -0.39 0.695 -5.32e-10 3.55e-10
TDIDIK .0110574 .0023238 4.76 0.000 .0065028 .0156119
UMUR -.001517 .000759 -2.00 0.046 -.0030046 -.0000294
PENGAL -.0013362 .0009078 -1.47 0.141 -.0031155 .0004432
EXP 1.76e-10 1.01e-10 1.75 0.080 -2.11e-11 3.74e-10
1.DRISK -.012705 .0159536 -0.80 0.426 -.0439735 .0185636
1.DSKALA .0188477 .0407799 0.46 0.644 -.0610794 .0987748
1.DMILIK -.0037339 .0479036 -0.08 0.938 -.0976233 .0901555
1.DSTATUS .0824379 .0268418 3.07 0.002 .0298289 .1350468
Note: dy/dx for factor levels is the discrete change from the base level.
Membaca margins dydx sama seperti membaca coefisien pada regresi OLS.
Contohnya utk variabel TDIDIK.
dy/dx utk variabel TDIDIK bertanda positif. Artinya, setiap kenaikan 1 tahun tingkat pendidikan, akan
meningkatkan peluang berpartisipasi kredit sebesar 1,105 persen.
Contoh utk variabel UMUR.
dy/dx variabel UMUR bertanda negatif. Artinya, setiap kenaikan umur 1 tahun akan mengurangi
peluang berpartisipasi kredit sebesar 0,1517 persen.
5. Membuat variabel baru.
Misalnya profit ingin dibuat nilai LN nya.
gen lnprofit = ln(PROFIT)
Misalnya PENDAPU ingin dibuat nilai LN nya.
Gen lnpendapu = ln(PENDAPU)
6. Membuat tabulasi
Misalnya DPARTIS dengan DSKALA
tab DPARTIS DSKALA
. tab DPARTIS DSKALA
D=1
partisipas
i; D=0 tdk
partisipas D=0 mikro; D=1 kecil
i 0 1 Total
0 3,981 154 4,135
1 2,191 114 2,305
Total 6,172 268 6,440
7. Membuat summary/deskripsi variabel
Misalnya summary variabel PENDAPU
sum PENDAPU
. sum PENDAPU
Variable Obs Mean Std. Dev. Min Max
PENDAPU 6083 1.92e+07 4.23e+07 0 1.00e+09
Seandainya ingin summary beberapa variabel sekaligus:
sum PENDAPU PENDAPLAIN EXP FISET KREDIT
. sum PENDAPU PENDAPLAIN EXP FISET KREDIT
Variable Obs Mean Std. Dev. Min Max
PENDAPU 6083 1.92e+07 4.23e+07 0 1.00e+09
PENDAPLAIN 6445 3656489 4.60e+07 0 1.00e+09
EXP 6387 7.31e+07 8.53e+07 2464250 1.73e+09
FISET 6445 4.93e+07 1.86e+08 0 3.54e+09
KREDIT 2207 2.44e+07 6.38e+07 0 1.00e+09
Seandainya ingin summary yg spesifik memiliki karakteristik tertentu,
Misalnya summary khusus utk usaha mikro (DSKALA = 0) yg berpartisipasi kredit (DPARTIS =1)
sum PENDAPU PENDAPLAIN EXP FISET KREDIT if DSKALA==0 & DPARTIS==1
. sum PENDAPU PENDAPLAIN EXP FISET KREDIT if DSKALA==0 & DPARTIS==1
Variable Obs Mean Std. Dev. Min Max
PENDAPU 2082 1.73e+07 3.05e+07 0 4.80e+08
PENDAPLAIN 2191 2459153 3.13e+07 0 1.00e+09
EXP 2176 7.65e+07 8.05e+07 5688000 8.20e+08
FISET 2191 4.14e+07 1.45e+08 0 2.10e+09
KREDIT 2098 2.25e+07 5.89e+07 0 1.00e+09
8. Membuang variabel yang tidak terpakai
Misalnya membuang variabel BBB
drop BBB
jika ingin membuang beberapa variabel sekaligus:
drop BBB PROFIT PENDAPU UMUR
jika ingin membuang nilai missing yang ada pada variabel PROFIT:
drop if mi(PROFIT)
9. Menyisakan variabel
Misalnya ingin membuang semua variabel kecuali PROFIT dan DPARTIS
keep PROFIT DPARTIS
10. Recode
Misalnya ingin merubah DSKALA, skala mikro (0) ingin dijadikan (1). Dan skala kecil (1) ingin
dijadikan (0).
recode DSKALA (0=1) (1=0)
seandainya perubahan kode itu ingin dijadikan varibel dengan nama baru, misalnya SKALABARU:
recode DSKALA (0=1) (1=0), gen(SKALABARU)
11. Ingin menggabungkan variabel dari dataset yg berbeda, gunakan command merge
Cara menggunakannya lihat help merge
12.