Acil Tıp Akademisi Alt Komisyonu
  • ATAK
    • Hakkımızda
      • Tarihçe
      • Vizyon ve Misyon
      • Amaç ve Hedefler
      • Eğitmen Kriterleri
    • Kurullar
      • Yürütme Kurulu
      • Üyeler
    • Belgeler
      • Yönerge ve Diğer Belgeler
      • Faaliyet Raporları
      • Kılavuz ve Rehberler
      • Raporlar
  • Yazılarımız
  • Etkinliklerimiz
    • Kurslarımız
      • Genel Bilgiler
      • ATAKOnline İstatistik Kampı
      • Eğitmen Kriterleri
      • Kurs Koordinatörleri
    • Tamamlanan Kurslar
      • Tamamlanan Kurslarımız
      • Klinisyenler İçin Araştırma Planlama Kursu
      • Klinisyenler İçin Makale Yazımı Kursu
    • Sempozyum ve Kongreler
  • İçeriklerimiz
    • Videolar
      • Videolar
      • İstatistik videoları
    • Yazılar
      • Araştırma planlama yazıları
      • İstatistik yazıları
      • Makale yazımı yazıları
  • İstatistik Hesaplama Araçları
  • Ön Kayıt Formu
  • İletişim
Aidat Ödemesi Bağış
  • Üye Girişi
Acil Tıp Akademisi Alt Komisyonu
  • ATAK
    • Hakkımızda
      • Tarihçe
      • Vizyon ve Misyon
      • Amaç ve Hedefler
      • Eğitmen Kriterleri
    • Kurullar
      • Yürütme Kurulu
      • Üyeler
    • Belgeler
      • Yönerge ve Diğer Belgeler
      • Faaliyet Raporları
      • Kılavuz ve Rehberler
      • Raporlar
  • Yazılarımız
  • Etkinliklerimiz
    • Kurslarımız
      • Genel Bilgiler
      • ATAKOnline İstatistik Kampı
      • Eğitmen Kriterleri
      • Kurs Koordinatörleri
    • Tamamlanan Kurslar
      • Tamamlanan Kurslarımız
      • Klinisyenler İçin Araştırma Planlama Kursu
      • Klinisyenler İçin Makale Yazımı Kursu
    • Sempozyum ve Kongreler
  • İçeriklerimiz
    • Videolar
      • Videolar
      • İstatistik videoları
    • Yazılar
      • Araştırma planlama yazıları
      • İstatistik yazıları
      • Makale yazımı yazıları
  • İstatistik Hesaplama Araçları
  • Ön Kayıt Formu
  • İletişim
Perşembe, 12 Haziran, 2025
Son Yazılar
Klinisyenler için MAKALE YAZMA KURSU
Yüz yüze Klinisyenler için İstatistik-1 Kursu
Online İstatistik Kampı – Ekim 2022’de!
ATAK Yüz yüze Kursları Tekrardan Başlıyor!
Acil Tıp Akademisi Alt Komisyonu
Acil Tıp Akademisi Alt Komisyonu
Aidat Ödemesi
  • ATAK
    • Hakkımızda
      • Tarihçe
      • Vizyon ve Misyon
      • Amaç ve Hedefler
      • Eğitmen Kriterleri
    • Kurullar
      • Yürütme Kurulu
      • Üyeler
    • Belgeler
      • Yönerge ve Diğer Belgeler
      • Faaliyet Raporları
      • Kılavuz ve Rehberler
      • Raporlar
  • Yazılarımız
  • Etkinliklerimiz
    • Kurslarımız
      • Genel Bilgiler
      • ATAKOnline İstatistik Kampı
      • Eğitmen Kriterleri
      • Kurs Koordinatörleri
    • Tamamlanan Kurslar
      • Tamamlanan Kurslarımız
      • Klinisyenler İçin Araştırma Planlama Kursu
      • Klinisyenler İçin Makale Yazımı Kursu
    • Sempozyum ve Kongreler
  • İçeriklerimiz
    • Videolar
      • Videolar
      • İstatistik videoları
    • Yazılar
      • Araştırma planlama yazıları
      • İstatistik yazıları
      • Makale yazımı yazıları
  • İstatistik Hesaplama Araçları
  • Ön Kayıt Formu
  • İletişim
Copyright 2024 - All Right Reserved
Araştırma planlama yazılarıTATDakademik

Metodoloji: Çalışma tipleri

by Haldun Akoğlu 6 Şubat 2020
written by Haldun Akoğlu
DOI

Bir klinik araştırmanın metodolojisi ve taksonomisi

Tıpkı biyolojik taksonomide olduğu gibi çoğu çalışmayı kategorize etmek için benzer bir hiyerarşiden yararlanabiliriz (Şekil 1) [1,2].

Şekil 1. Araştırma Tiplerinin Taksonomisi

Bir çalışmanın anatomisi, yani metodu, o çalışmanın neyi bildirip neyi bildiremeyeceğini bize anlatır. Biz okuyucular için en önemli handikaplardan biri de yazarların her zaman çalışmanın tipini belirtmemesi ve bizim çıkarım sağlamamıza olanak verecek ayrıntılardan bahsetmemeleridir. Daha kötüsü, yazarlar bazen çalışmanın tipini yanlış belirtebilir. Örneğin, randomize olmayan kontrollü çalışmaları, randomize kontrollü olarak; eşzamanlı olmayan kohort çalışmaları da vaka-kontrol çalışması olarak belirtmek sık karşılaşılan hatalardandır. Vaka-kontrol kelimesinin de uygunsuz biçimde her kontrol grubu olan çalışmada kullanıldığını görmekteyiz. Biyolojinin ana grupları olan hayvanlar ve bitkiler gibi, klinik araştırmaların da ana grupları deneysel ve gözl emsel çalışmalardır (Şekil 2).[3]

Şekil 2. Araştırma Tipleri
Bu noktada kohort kelimesinin biraz üstünde durmakta fayda var. Kohort kelimesi tıbbi değil askeri bir terimdir. Doğu Roma İmparatorluğu’nda 300 ila 600 kişilik birliklere kohort adı verilirdi. 10 kohort bir lejyonu oluştururdu. Kohort; ortak bir tecrübe, maruziyet ya da durumu paylaşan insanlar anlamında kullanılır. Mesela doğum kohortu aynı yıl doğanları, sigara içenler kohortu sigara içme yönünden ortaklığı olan bir grubu belirtir. Bu açıdan insanların birim ölçek olduğu tüm çalışmalarda örneklenmiş insan toplulukları aslında birer kohorttur.

Gözlemsel çalışmalar

Bu çalışma dizaynı ilevar olan bir durumun farklı yönleri gözlenir. Anket ya da vaka sunumunu buna örnek verebiliriz. Elde ettiğimiz veriler yoluyla gözlediğimiz durumla beraber bulunan farklı yönleri sayısal biçimde açıklamaya çalışırız.

Literatürün çoğunu oluşturan gözlemsel çalışmalar [4] karşılaştırma veya kontrol grubu olup olmamasına göre sınıflandırılır. Bu tip bir karşılaştırma öğesi bulunan gözlemsel çalışmalara analitik, olmayanlara tanımlayıcı çalışma adı verilir. Analitik çalışmalarda maruziyet ve sonlanımların sırası çalışmanın alt tipini belirler. Bizim etkin olmadığımız (yani bizim uygulamadığımız) bir maruziyete uğramış vakaları alıp sonrasında sonlanım gelişen ve gelişmeyen vakaları karşılaştırıyorsak buna kohort çalışma adı verilir. Kohort çalışmalar eşzamanlı olabilir ya da olmayabilir. Gelişmiş olan sonlanımlara sahip vakaları geriye doğru tarayıp belirli bir maruziyete sahip olma ve olmama durumlarını karşılaştırıyorsak vaka-kontrol çalışması, hem maruziyet hem de sonlanım varlığını aynı zaman diliminde beraber gözlemleyip karşılaştırıyorsak kesitsel bir çalışmadan bahsediyor oluruz.

Araştırma hiyerarşisinin en altında tanımlayıcı çalışmalar gelir. Vaka sunumu bunun en basit örneğidir. Birden çok vakanın bir araya getirildiği sunumlara ise vaka-serisi adı verilir.

Tanımlayıcı çalışmalar

Araştırma hiyerarşinin en altında gelen tanımlayıcı çalışmalar ile araştırmacılar bir hastalık ya da durumun frekansını, doğal gidişatını ve muhtemel etkileyicilerini tanımlarlar. Bu çalışmaların sonuçlarından belirli bir zaman içinde kaç kişinin bu hastalık ya da duruma sahip olduğunu, etkilenenlerde hastalığın gidişat ve özelliklerini öğrenebiliriz.

Tanımlayıcı çalışmalar bilimsel bilgi havuzuna dökülen ilk damlalar gibidir. Konu edilen hastalık ya da durumun net, ayrıntılı ve ölçülebilir bir şekilde tanımlanmış olması şarttır. Klasik olarak tanımlayıcı bir tıbbi rapor kişi, yer ve zaman bilgisini; yani ajan, konakçı ve ortam bilgisini vermelidir. Bu klasik tanımlamayı biraz daha ileri götürürsek, modern bir tanımlayıcı araştırmanın tıpkı iyi bir gazetecinin yaptığı gibi Kim, Ne, Neden, Nasıl, Nerede ve Ne zaman sorularından oluşan 5N1K setinin bütününü cevaplaması gerektiğini söyleyebiliriz [2,5,6]. Bu 6 soruya bir de 7. soru olarak “peki ya şimdi” sorusunu eklemek ve buna yanıt vermeye çalışmak da tanımlayıcı çalışmanın ardından gelecek, taksonomide daha yüksek kanıt düzeyine sahip çalışmalara altyapı oluşturur. Yazarlar bu işlemi muhtemel sebepler ve sonuçlar hakkında teorilerini ortaya atarak yaparlar. Bu teorilerin karşılaştırmalı analitik ya da deneysel metodlarla ispatlanması gereklidir.

Tablo 1. Tanımlayıcı araştırmaların bildiriminde yanıtı verilmeye çalışılan sorular

Soruİçerik
Kim?Hastalığa sahip olanlar kim?
Ne?Çalışılan ya da bildirilen hastalık ne?
Neden?Neden bu hastalık ya da durum gelişti?
Nasıl?Nasıl ilerler ve kendini gösterir?
Nerede?Nerede ortaya çıkar?
Ne zaman?Ne zaman ortaya çıkar veya daha sık görülür?
Peki ya şimdi?Neden bu hastalık önemli?

Vaka sunumları, vaka serileri, sürveyans çalışmaları, ekolojik korelasyon çalışmaları, trend analizleri, sağlık planlamaları tanımlayıcı çalışmaların bütününü oluşturur. Ancak bu çalışmalar sebep-sonuç ve benzerleri gibi herhangi bir ilişki hakkında yorum yapmaya izin vermez. Tanımlayıcı çalışmalarla ilgili en sık yapılan hata da bu şekilde çıkarımlarda bulunmaktır.

1.     Vaka sunumları

Bir gözlemcinin nadir bir hastalık, durum ya da ilişkiyi bildirdiği raporlardır. Bu raporlar tek bir hastaya ait tıbbi bir öyküyü bir düzen içinde sunan makalelerdir. Aynı hastalığa ait birkaç vaka sunumu bir araya getirilerek vaka serileri olarak da sunulabilirler. Kanıt düzeyi düşük olmakla birlikte bazen çok önemli yan etkilerin veya hastalıkların tanımlanması bir olgu sunumunun duruma dikkati çekmesi ile başlayabilir. Bu duruma örnek olarak talidomid kullanan bir annenin her iki bebeğinin de fokomeli ile doğduğunu fark ederek bu durumu bir vaka sunumuna dönüştüren doktorun diğer meslektaşlarında oluşturduğu farkındalığı gösterebiliriz.[7] Bildirilen vaka sunumları daha ileri tekniklerle yapılan çalışmalar için altyapı oluşturur.

2.     Vaka serileri

Benzer vakaları bir araya getiren raporlardır. Bazen bir epidemi ya da bölgesel birikimi göstererek ileri incelemelerin başlatılmasına yardımcı olurlar.

3.     Sürveyans

Halk sağlığı pratiğinde sağlık planlamaları, uygulamaları ve değerlendirmeleri için gereken sağlık verilerinin belirli zaman aralıklarıyla sistematik biçimde toplanması, analizi ve yorumlamasını takiben bu verileri kullanacaklarla paylaşılmasıdır. Pasif sürveyans Ölüm Bildirim Sistemi (ÖBS) gibi bir kayıt sisteminde otomatik olarak elde edilen verileri birleştirirken, aktif sürveyans ile belirli bir vaka çeşidi özel olarak araştırılır ve incelenir. Sürekli sürveyans ve aşılama sayesinde su çiçeği hastalığının eradikasyonunun sağlanması, epidemiyolojik sürveyansın önemine en güzel örnektir.

4.     Ekolojik korelasyon çalışmaları

Ekolojik korelasyon çalışmaları maruziyet ve sonlanımlar arasındaki ilişkiye, bireyler üzerinden değil toplumlar üzerinden bakar. Koroner arter hastalığından ölüm sayısı ile kişi başına satılan sigara sayısı arasındaki ilişki gibi, halihazırda toplanan verilerin birbiri ile ilişkisini sayısallaştırmayı amaçlar. En önemli eksiklik tüm tanımlayıcı çalışmalarda olduğu gibi sebep-sonuç ilişkisinin kurulmasının mümkün olmamasıdır. Aynı şekilde koroner arter hastalığıyla renkli televizyon satışları arasında da yüksek bir ilişki belirlenmiştir. Televizyonda gösterilen saldırganlık ile okul içi saldırganlık arasında da güçlü bir ilişki vardır. Bu tip ilişkilerden hangisinin gerçek hangisinin karıştırıcı olduğu ileri tekniklerle analiz edilmelidir.

Analitik Çalışmalar

Analitik çalışmalar ise vaka-kontrol çalışmaları, kohort (prospektif/retrospektif) çalışmalar ve kesitsel çalışmalar olarak özetlenebilirler.

Vaka-kontrol tipi çalışmalarda daima retrospektif (geçmişteki sonuçlara bakılarak yorumlanan) “Ne oldu?” sorusuna yanıt aranır. Bu araştırmalar neden-sonuç ilişkisini irdeler. Çalışmanın bir kohort tipi araştırma olup olmadığını anlayabilmek için ise “Ne olacak?” sorusuna yanıt verip vermediğine bakılabilir.

Çoğu kohort tipi çalışma prospektif olarak (gelecekte gerçekleşecek sonuçların incelenmesi) yapılandırılmıştır. Bu çalışmalarda insidans ve rölatif risk gibi çok değerli verilere ulaşılır. Olası risk etmeninin gerçekten önemli olup olmadığı anlaşılır.

Kesitsel bir çalışmada ise “Ne oluyor?” sorusu yanıtlanır ve toplumdaki bir sağlık sorununu tespit etmek genellikle amaçtır. Genellikle hastalık prevalansı (sıklığı), hastalık mekanizmaları ve tanısal sorunların çözümü için yapılan bu çalışmalara güzel bir örnek, ülkemizdeki kalp hastalıklarına neden olan hipertansiyon, diabetes mellitus gibi hastalıkların prevalansının tespiti ile yaş ve cinsiyetle ilişkisinin incelendiği TEKHARF çalışmasıdır. [8,9]

Deneysel Çalışmalar

Bu çalışma dizaynında ilaç vermek ya da bir girişim uygulamak gibi bir şekilde biz bir şeyler yaparız. Böylece yaptığımız uygulamanın sonuçlarını değerlendirme imkanımız olur. Dolayısıyla, araştırmacı maruziyetleri kendisi oluşturuyorsa deneysel, kendi etkisi olmayan maruziyetler üzerinden araştırma yapıyorsa gözlemsel bir çalışma yürütmektedir diyebiliriz. Burada maruziyet, sonlanım üzerinde etkisi araştırılan her türlü olay, girişim ya da ilaç olabilir. Sonlanım ise fayda-zarar etkisinin hesaplanması için kullanılan, bir oran ya da ölçüyle ifade edilebilen her türlü bulguya işaret eder.

Klinik araştırma

Deneysel araştırmalar insanlar üzerinde yapılıyorsa bunlara klinik araştırma adı verilir. Örneğin, girişimsel sedo-analjezide kullanılan farklı ilaçların etkilerini karşılaştırma amacıyla dizayn edilen deneysel çalışma bir klinik araştırma, kullanılan farklı ilaçların her biri araştırmacı tarafından belirlenmiş farklı birer maruziyet, sedasyon süresi, analjezi derinliği ya da hasta memnuniyeti de sonlanımlardır. Bazı nüanslar dışında deneylerde geçerli kuralların hepsinin klinik araştırmalar için de geçerli olduğu söylenebilir.

Bağımsız eşzamanlı kontrollü araştırma

Ana yapı olarak dörde ayrılan deneysel araştırmaların en önemli gruplarından biri bağımsız eşzamanlı kontrollü araştırmalardır. Bu araştırmalar bir deney grubu ve kontrol grubu içerirler. Eğer hastanın hangi gruba alınacağı rastgele bir yöntemle saptanıyorsa bu araştırma randomize kontrollü bir araştırma olacaktır. Deneklerin gruplara alınma yöntemi önceden belirlenmiş ise randomize olmayan kontrollü bir çalışma dizayn edilmiştir. Eğer hem denekler hem de araştırmacılar deneğin hangi grupta olduğunu bilmiyorlarsa çift, sadece denekler hangi yöntemin uygulandığını bilmiyorlarsa tek-kör araştırmadan söz edilir. Çift kör, randomize kontrollü araştırmalarda elde edilen veriler daha objektif oldukları için kanıt düzeyleri güçlü olarak değerlendirilirler.[8] Bu çalışmalar bir ilaç ya da girişimin sınanacağı deneylerde kullanılırlar. Kendi kendine kontrollü araştırmalar ise deney ve kontrol grupları içinde farklı denekler bulunduğu durumlarda randomizasyona rağmen gruplar arasında istenilen benzerliği sağlanamadığı durumlarda tercih edilirler. Çözüm olarak denekler hem deney hem kontrol grubunda yer alırlar. Örneklersek; serum kolestrol düzeyini düşürmede etkili olabilecek iki tür diyetin karşılaştırıldığı bir çalışmada obezite, ailesel lipid metabolizma bozuklukları gibi kontrol edilemeyen bireysel farklılıkları giderebilmek amacı ile hastalar önce hem kontrol hem de deney grubunda yer alırlar. Önce-sonra tipindeki bu araştırmalar da ilk önce normal diyetle beslenen bir hasta grubu serum kolestrol düzeyi ölçülür, sonrasında ise bu düzey diyet tipine göre bir süre sonra aynı grupta ölçülerek karşılaştırılır.[9]

Çapraz Dizayn

Diğer bir deneysel araştırma yöntemi ise çapraz dizayn çalışmalardır. Bu araştırma düzeninde başlangıçta oluşturulan iki bağımsız gruptan birine araştırılan yöntem veya ilaç uygulanır diğerine ise plasebo verilir. Bir süre sonra etkiler kaydedilir ve uygulanan yönteme (eğer ilaç ise an az yarılanma ömrünün 4 katı kadar ara verilerek – arınma periyodu) gruplar çaprazlanır. Bu araştırma  sonuçları oldukça güvenilir ve güçlü olarak kabul edilirler. Ancak arınma durumunda ilaçsız kalma pek çok klinik durum için uygun ve etik olmayabilir. Son olarak dış kontrollü araştırmalar da deneysel araştırmalardandır. Bu araştırmalarda kontrol grubu başka bir araştırma grubuna veya daha önce uygulanan bir yönteme ait olabilir. Örneklemek gerekirse; portal hipertansiyon için uygulanan bir cerrahi yöntemin sonuçlarının on yıl önceki eski yöntemin uygulandığı hasta grubu ile karşılaştırılması.[8]

Metodolojik Çalışma

Diğer araştırma tipleri ise metodolojik araştırmalardır ve tanı ve tarama yöntemlerinin geçerliliğine yönelik çalışmalar, gözlemcilerin ölçüm yöntemlerinin güvenilirliğine yönelik araştırmalar ve matematik simulasyon modelleri ile yapılan araştırmalar olarak sınıflanırlar.

Makalelerin konu temelinde sınıflaması

Araştırma makaleleri genellikle aşağıda verilen ana konulardan birine yönelik olarak yukarıda belirttiğimiz dizaynlarda planlanmış çalışmaların yayınlanmış halleridir.

Tedavileri inceleyen makaleler

Bir ilaç, cerrahi girişim veya alternatif hasta eğitim ya da uygulamaları gibi yöntemlerin etkinliğini inceleyen bu makaleler için tercih edilmesi önerilen araştırma şekli randomize kontrollü çalışmalardır.

Tanı yöntemlerine yönelik araştırmalar

Yeni bir tanısal yöntemin geçerli (bu teste güvenelim mi?) ve güvenilir (testi her tekrar ettiğimizde aynı sonuçlara mı ulaşırız?) olup olmadığını araştırmak için yapılan bu araştırmalar için önerilen yöntem ise yeni yöntemin ve altın standart yöntemin birlikte uygulandığı kesitsel çalışmalardır.

Taramalar

Bir testin presemptomatik durumdaki hastalarda tanı amaçlı kullanımını inceleyen çalışmalardır, önerilen çalışma dizaynı kesitsel tiptedir.

Prognoz saptayıcı araştırmalar

Bu araştırmalar erken dönemde herhangi bir hastalığı olan bireyin prognozunu inceler, önerilen araştırma tipi uzun süreli prospektif kohortlardır.

Nedensellik araştırmaları

Bu araştırmalar da ise çevresel kirlilik gibi zararlı bir ajanın neden olduğu hastalıklar incelenir. Önerilen araştırma yöntemleri kohort ya da olgu kontrol tipi araştırmalar olabileceği gibi ender görülen durumlarda (kot taşlama işçilerinde silikozis gibi..) olgu raporlarından da önemli ip uçları elde edilebilir.[7]

İkincil Çalışmalar

Kanıta Dayalı Tıp (KDT) uygulamalarında kullanılan kanıtların hiyerarşik dizilimlerinde en üst düzeyde sistematik derlemeler ve meta-analizler yer alır.[10] Bu çalışmaların yapılması esnasında belli aşamalardan oluşan bir metodoloji izlenir. Bu araştırmalar birincil tipte yürütülen araştırma verilerinin ikincil analizi şeklinde yürütülür. Sistematik derlemelerde bir protokol esasınca derlemeye alınacak yayınlar seçilir ve uygun çalışmaların bulguları yorumlanır. Sistematik derlemelerde her zaman istatistiksel analiz yapılması şart değil iken meta-analizlerde benzer tasarımı olan farklı çalışma bulgularından toplu olarak istatistiksel analiz yapılmaktadır. Bir meta-analiz, sistematik derleme metodolojisi ile çalışmaları seçmiş ise “sistematik bir meta-analiz” olarak değerlendirilir ve varılan sonucun kestirim gücü artar. Bu tipte yapılan araştırmalarda birçok çalışma bir araya getirilerek hem örneklem büyüklüğü hem de istatistiksel güç arttırılır. Seyrek görülen hastalıklar daha büyük gruplarda incelenebilir.

Bir makalenin sistematik derleme mi yoksa meta-analiz mi olduğuna karar verebilmek için bizi meta-analiz yönünde düşündürecek olan şu kıstaslara dikkat edilir:

  1. Önceden belirlenmiş bir amaca uygun olarak araştırma protokolü belirlenmiş mi?
  2. Analize alınan çalışmaların çalışmaya dahil etme ve etmeme kriterleri var mı?
  3. Seçilen yayınlardan elde edilen verilerin hangi istatistiksel yöntemler ile yeniden analize tabii tutulduğu belirtilmiş mi?
  4. Elde edilen sonuçlar tıpkı bir araştırma makalesi gibi IMRAD yapısında mı yazılmış?

Bilimsel Kanıtların Değerliliği

Makalelerin bilimsel kanıt düzeylerine göre dizilimi ise içerdikleri bilgi yükü ve objektif yönteme sahip olmalarına göre belirlenmiş geleneksel bir sıralamaya sahiptir. Bu sıralamaya göre en değerli bilimsel kanıtlar sistematik derlemeler ve meta-analizlerden elde edilirler. Bu çalışmaların değerli olmasının nedeni belirlenmiş bir yöntem doğrultusunda birden fazla örneklem grubunda elde edilen verilerin bir arada yorumlanması olarak özetlenebilir.  İkinci sırada değerli kanıt kaynakları ise kesin tanımlayıcı sonuçlara işaret eden (güven aralıkları kesişmeyen klinik anlamlı etki düzeyleri gibi..) randomize kontrollü çalışmalardır. Üçüncü sırada ise yine randomize kontrollü çalışmalar bulunmakla birlikte  bu çalışmalardan elde edilen kesinleşmiş tanımlayıcı sonuçlar bulunmaz.  Randomizasyon ve tanımlanmış deney ve kontrol gruplarının bulunması bu çalışmaların yöntemsel hata yapma olasılığını azalttığı için çalışmalarda elde edilen veriler değerli olmaktadır. Daha sonraki sırada ise kohort çalışmaları, olgu kontrol tipi araştırmalar, kesitsel çalışmalar ve en sonda ise olgu sunumları yer almaktadır.[7]

Şekil 3. Çalışma tiplerinin zamanla ilişkisi

Kaynaklar

  1. Guyatt G. Users’ Guides to the Medical Literature: A Manual for Evidence-Based Clinical Practice, 3E. McGraw Hill Professional  2014.
  2. Schulz KF, Grimes DA. The Lancet Handbook of Essential Concepts in Clinical Research. The Lancet 2006.
  3. Hulley SB, Cummings SR, Browner WS, Grady DG, Newman TB. Designing Clinical Research. Lippincott Williams & Wilkins  2013.
  4. Funai EF, Rosenbush EJ, Lee MJ, Del Priore G. Distribution of study designs in four major US journals of obstetrics and gynecology. Gynecol Obstet Invest 2001;51:8–11.
  5. Buring JE. Epidemiology in Medicine. Lippincott Williams & Wilkins  1987.
  6. Lilienfeld DE. Lilienfeld’s Foundations of Epidemiology. Oxford University Press, USA  2015.
  7. Greenhalgh T. How to Read a Paper. John Wiley & Sons  2014.
  8. Hayran M. Sağlık Araştırmaları İçin Temel İstatistik. Omega Araştırma  2011.
  9. Onat A. Lipids, lipoproteins and apolipoproteins among turks, and impact on coronary heart disease. Anadolu Kardiyol Derg 2004;4:236–45.
  10. Jones C. Evidence-based medicine: (1) Research methods. Pharmaceutical Journal 2002;268:839–41.
6 Şubat 2020 0 comments
0 FacebookTwitterPinterestEmail
İstatistik yazılarıTATDakademik

Jamovi nasıl kullanılır?

by Haldun Akoğlu 6 Şubat 2020
written by Haldun Akoğlu
DOI

İleri istatistik kursumuz için 2 haftadan kısa bir süre kalmışken Temel İstatistik ve metodoloji kurslarımızda hep sorulan sorulardan birinin tekrar edileceğini düşünerek bu yazıyı kaleme almaya karar verdim: “SPSS, SAS paralı ve karmaşık. Kolay bir istatistik paket programı önerebilir misiniz?”

Bu sorunun ucuz (hatta ücretsiz) kısmı için uzun süre sadece tek bir yanıtımız vardı: R istatistik programlama dili. Ama bu ücretsiz paket son derece karmaşık komutları öğrenmek için ciddi bir zaman yatırımı içeriyordu. Benim de favorim olan ve neredeyse her işlem için rutin kullandığım MedCalc, döviz kurlarının yükselişi ile ucuz olmaktan yavaş yavaş çıktı. Üniversiteler tarafından verilen ücretsiz SPSS ve SAS ağ sürümleri ile Kadıköy Yazıcılar iş hanı çözümlerini saymazsak kendi temel analizlerini yapmak isteyen klinisyenler için alternatif kalmamıştı.

Muenchen ve ark tarafından 2015 yılında yayınlanan analize göre (RA Muenchen, 2015, http://r4stats.com/articles/popularity) en popüler analiz yazılımı istisnasız SPSS.[1] Ama R korkunç bir hızla yükselerek neredeyse SPSS’i yakalamış vaziyette. Bu analizde R paketinin kolaylaştırılması ve kullanımının yaygınlaştırılmasına yönelik bazı “üst” programlar da eklenmiş durumda. Bunlardan en önemlileri Jamovi[2] ve JASP[3]. Jamovi biraz daha görsel ve daha kolay ama ikisi de çok benzer. İkisi de R istatistik programlama dili üzerine yazılmış, aslında R paketlerini kullanan ama görselleştiren birer üst paket ve birbirini tamamlayan fonksiyonları mevcut.

Jamovi (www.jamovi.org)

Jamovi, R üzerine yazılmış, sadece tıklama ile tüm fonksiyonların yerine getirilebileceği ve neredeyse başka hiçbir paket gerektirmeyecek, tamamen ücretsiz bir program. SPSS .sav dosyalarını açabiliyor. Bunun dışında .csv ya da .txt dosyalarını da açarken hiç sorun yaşatmıyor. Eğer Excel’e kaydettiğiniz verileriniz varsa Save As… diyerek .csv formatında kaydedip rahatlıkla Jamovide açabilirsiniz.

jamovi

Boş bir Jamovi açtığınızda 2 ekranlı bir yapı göreceksiniz. Solda Excel usulü bir veritabanı kısmı, ve sağda dökümler ve grafiklerin canlı canlı görüneceği ekranımız. Ortadaki sütundan tutarak sola sağa bunların boyutlarını değiştirebilirsiniz.

jamovi

Jamovi, yukarıda Data ve Analyses olmak üzere 2 tab bulunan sadece iki kurdele menüden ibaret. Sütunlar değişkenlere satırlar vakalara ait. Her sütunun başında değişken isminin yanında değişken tipini işaret eden bir de görsel var. Sütun başlığına 2 kez tıklayarak değişken ayarlarını açabiliyoruz:

jamovi

Bu kısımda değişken ismi ve etiketini değiştirebiliyoruz. Değişken tipini sürekli (continuous) ve kategorik (ordinal ya da nominal) olarak seçebiliyoruz. Ayrıca sıra numarasını ifade eden ID değişkenini de belirleyebiliriz. Veri tipi olarak değişkenin ne içerdiğini heman altında aşağı açılan menüden belirliyoruz. Eğer değişken tipi olarak kategoriklerden biri olan ordinal ya da nominali seçersek, o değişkenin aldığı tüm değerler Levels kısmında sağda veriliyor. Eğer kategorik bir değişken ise buradaki sayıların üzerine tıklayarak o sayının karşılık geldiği kategorinin ismini yazmanız mümkün.

Değişkenlerin hepsini bu şekilde programa tanıttıktan sonra Analyses tabına geçebiliriz.

jamovi

Tanımlayıcıların dökümü

İlk seçeneğimiz Exploration… Bu menünün altındaki tek seçenek Descriptives… Tanımlayıcı istatistiklerimizi buradan dökeceğiz.

jamovi

Bu seçeneği seçtiğimizde solda ayarlamaları yapacağımız kısım, sağda ise henüz doldurulmamış ve döküm tablosu karşımıza gelecek. Sol panelde değişkenlerimiz ve veri tiplerini gösteren işaretler yer alıyor. Buradan değişkenlerimizi seçip Ok tuşuna basarak Variables (yeni analiz edeceğimiz değişken/ler) veya Split By (gruplama değişkenlerimiz) kısımlarına götürdüğümüz anda Döküm panelinde (sağ beyaz boşluk) sonuçlar görünmeye başlayacak.

Bu son derece şaşırtıcı şekilde hızla gerçekleşiyor. SPSS’de 70 yere basmadan ilerleyemeyen ben ilk seferinde bayağı etkilenmiş ve şaşırmıştım.

Eğer herhangi bir kategoriye göre bölmek istemezsek Split By kısmını boş bırakıyoruz. Tanımlayıcılar olarak rutinde N (vaka sayısı), Missing (eksik/boş vaka sayısı), Mean (ortalama), Median, Minimum ve Maximum değerleri sadece veriliyor. Bu elbette çok ama çok yetersiz. Hemen soldaki panellerin altında yer alan Statistics açılır menüsüne tıklayınca cevher ortaya çıkıyor.  Rutinde işaretleyecekleriniz N, missing, mean, median, quartiles, Std. deviation ve Shapiro-Wilk olmalı. %95 Güven aralıkları bu panelden dökülemiyor (keşke olsaydı).

Seçenekleri işaretler işaretlemez Döküm panelinde sonuçlar görülmeye başlıyor.

Üstteki örnekte önce sürekli bir değişkeni analiz paneline geçirdik: yaş. Bu değişkenin normal dağılmadığını (Shapiro-Wilk <0,001) bu sebeple de medyan ve interkuartil aralık bildirmemiz gerektiğini rahatça görebiliriz. Medyan değeri 35, interkuartil kenarlar da 25 ve 75. persentiller yani 26-48, ya da interkuartil aralık bunların farkı  22.

Cinsiyeti Split By paneline çeker çekmez yaş değişkeninin cinsiyet alt gruplarına göre dökümünü alıyoruz. Dökümdeki her bir elemanın üzerinde sağ tıklayarak tüm analizi (analysis), ya da sadece bir grafik ya da tabloyu (table) kopyalayabilir (Copy) ya da Save As diyerek PDF formatında kaydedebiliriz.

Tanımlayıcı grafiklerin hazırlanması

Jamovi’nin en kuvvetli yanlarından biri de olağanüstü hızda son derece yeterli ve baskı kalitesinde grafikler hazırlanmasını sağlaması. Tanımlayıcı grafikler için Statistics panelinin hemen altındaki Plots panelini tıklayarak bunu açıyoruz.

Histogram, Kutu-çizgi (box-plot) grafiği, Kutu (bar) grafiği, QQ plot çizdirebileceğimiz grafikler. Her birinin yanında hangi tip veri için uygun oldukları şekillerle belirtilmiş. Histogram kutusunu işaretler işaretlemez alttaki gibi yaşın cinsiyetlere göre bölünmüş histogramlarını elde ediyoruz. Veri yukarıdaki panellere nasıl girildiyse, hangi etiketler kullanıldıysa grafik de öyle çıkıyor. Üstünde düzeltme imkanı yok. Eğer hatalı bir değişken ismi ya da grup ismi yazmışsak değişken paneline dönüp düzeltmemiz yeterli! Grafik de otomatik olarak düzeliyor, hem de hepsi!

Histogram seçeneği seçili

Histogram ve density seçenekleri seçili

Box-plot grafiği

Eğer kategorik bir değişkeni incelemek istiyorsak bu sefer analiz paneline yaş yerine bunu koymalıyız: mesela cinsiyet. Split By kısmını temizlediğimizde Statistics ve Plots panellerini temizlemediğimizden yine aynı hesaplamaları anında bize döküyor. Ancak cinsiyet nominal bir değişken olduğundan (kadınların erkeklerden üstün olmadığını, yani sıralı değişken olmadığını saymak durumundayız) ortalama, medyan, kuartiller anlamsız birer veri. Bizim ilgilendiğimiz çalışma popülasyonunda kaçar tane kadın ve erkek olduğu ve bunun yüzdeleri. Bu sebeple hemen veri panellerinin altında, yanında ordinal ve nominal değişken şeklinin olduğu Frequency tables seçeneğini seçmemiz gerekiyor.

İşimize yaramayan seçenekleri kapatarak kalabalığı azaltabiliriz.

Kategorik değişkenleri de kategorik değişkenler altında analiz edebiliriz.

Yaptığımız döküm ve grafiklerden memnunsak ve başka analize geçeceksek sağ üstteki çember içindeki sağa ok seçeneğini seçiyor ve dökümü sağ panele kaydediyoruz.

Sürekli değişkenlerin 2 grup arasında karşılaştırılması

Bu amaçla T-tests seçeneği altındaki Independent samples t-test ve Paired samples t-test seçeneklerini kullanacağız.

Eğer sürekli değişken, karşılaştırılmak istendiği grupların her birinde normal dağılıyorsa sorun yok. Bağımsız gruplar varsa Independent samples t-test, ardışık ölçümler varsa Paired samples t-test kullanabiliriz.

Eğer sürekli değişken, karşılaştırılmak istendiği grupların herhangi birinde normal dağılmıyorsa parametrik olmayan testler kullanmamız gerekli.

Her iki testin de parametrik olmayan karşılıkları olan Mann-Whitney U ve Wilcoxon testleri kendi panellerinde birer kutucuk olarak var. Tıklamanız hesaplama için yeterli. Aynı panelde Assumption Checks altında normalite değerlendirmesi için Shapiro-Wilk testi ve QQ grafikleri de yer alıyor.

Hem de hatırlatma olması için burada test seçim kurallarını tekrarlayalım:

  • Eğer Shapiro-Wilks ile dağılım normal (p>0,05), varyanslar da eşitse (Levene testi p>0,05) Student t,
  • Eğer Shapiro-Wilks ile dağılım normal (p>0,05), varyanslar da eşit değilse (Levene testi p<0,05) Welch,
  • Eğer Shapiro-Wilks ile dağılım normal değilse (p<0,05) Mann-Whitney U testi

Eğer dergi editörünün gözlerini yaşartmak istiyorsanız p değeri yeterli gelmeyecektir. Sizden ortalama ya da medyan fark, farkın güven aralıklarını vermeniz istenecektir. A grubu dergiler anlamlı bir fark varsa etki büyüklüğünü (effect size, burada Cohen’s d) de vermenizi isterler. Bunların hepsini SPSS’de yapmak ömrünüzü çürütebilir ama Jamovi ile çok kolay.

Örneğimizde yaş normal dağılmıyor (cinsiyet grupları arasında da). Bu sebeple medyan, interkuartil aralıklar ve Mann-Whitney U testi sonuçlarını bildireceğiz. Kuartiller sadece önceki tanımlayıcı analiz kısmından elde edilebiliyor. Hepsini bir araya getirdiğimizde:

  • Erkeklerin ve kadınların medyan yaşları sırasıyla 35 yıl (İKA:25,8-47,3) ve 35 yıl (İKA:26,5-48,0) olup aralarında istatistiksel olarak anlamlı fark belirlenmemiştir (MWU p=0,829).

Bu panel otomatik olarak ortalama ve %95 güven aralıklarının olduğu hata grafiği de çiziyor. Bunun da örneğini hemen aşağıda görebilirsiniz. Ancak bu grafik üzerinde herhangi bir oynama yapamıyoruz.

Ki-kare testi

Çok gözlü tablolar için Frequencies >> contingency tables >> independent samples seçeneğini kullanacağız:

En temel şeklinde direk p değerini ve her hücreye düşen sayıları elde edebiliyoruz:

Ki-kare ile ilgili oldukça kapsamlı bir yazı yazmıştım. Bu seçeneklerin neler olduğunu oradan tekrar bakıp hatırlayabilirsiniz.

Kategorik değişkenler, Çok gözlü tablolar ve ki-kare hesabı

Tek yönlü ANOVA

ANOVA menüsü altından direk ulaşabiliriz. SPSS’e çok benzer seçenekleri mevcut:

Testi yapmadan normallik ve varyansların denkliği ön şartlarına bakmak gerekse de hem SPSS hem de burada test hepsini döküyor, biz bakıp karar veriyoruz.

Yukarıdaki örnekte gerekli yerleri ben işaretledim. Buna göre Shapiro-Wilk’in p değeri <0,05 olduğundan normallik ihlal edilmiş. Ancak varyanslar denk (Levene p=0,304). Bu durumda Kruskal Wallis yapmak gerekse de elimizde bilgisayar olduğundan her ikisini de yapıp birbirine çok benzer sonuçlar varsa ANOVA’yı geçerli kabul etmek en doğrusu. İki değer birbirine yakında normalliğin ihlal edilmesi ANOVA testini bozmamış demektir.

Dolayısıyla varyanslar denk olduğundan Fisher’in ANOVA p değerini kabul ediyoruz: p=0,578 arada fark yok.

Hemen Kruskal-Wallis de yapıp normalliğin ihlali birşeyleri bozmuş mu görelim.

Kruskal-Wallis ekranı çok basit. Değişkenleri yerine koyduğumuzda hesaplanan p değeri 0,702.

Her ikisi de anlamsızlık seviyesinde ve hangisinin kullanıldığı sonucumuz açısından fark etmiyor.

Son Söz

Kabaca günlük pratikte kullanacağınız fonksiyonlar bunlar. Hepsi bedava, hepsi de gayet şık.

Ben tüm kursiyer ve okurlarımıza yasal olmayan yollara başvurmak yerine Jamovi kullanmalarını öneriyorum.

Cite as

AKOGLU, Haldun. (2018, September 27). Jamovi nasıl kullanılır? (Version v1). Zenodo. http://doi.org/10.5281/zenodo.1442523

Kaynaklar

[1] “The Popularity of Data Science Software,” Robert A. Muenchen, 19-Jun-2017. [Online]. Available: http://r4stats.com/articles/popularity/. [Accessed: 07-Jan-2019] [2] “ jamovi – Stats. Open. Now. ,” Jamovi, 19-Jun-2017. [Online]. Available: https://www.jamovi.org/. [Accessed: 07-Jan-2019] [3] “JASP – A Fresh Way to Do Statistics,” JASP – Free and User-Friendly Statistical Software, 19-Jun-2017. [Online]. Available: https://jasp-stats.org/. [Accessed: 07-Jan-2019]

6 Şubat 2020 0 comments
0 FacebookTwitterPinterestEmail
Makale yazımı yazılarıTATDakademik

Kime Atıf? Neden Atıf?

by Gökhan Aksel 6 Şubat 2020
written by Gökhan Aksel


2011 yılının karlı bir kış günü, yeni çıkmış 7. baskı Tintinalli’s Emergency Medicine: A Comprehensive Study Guide isimli değerli kitabın sayfalarını karıştırırken, 30. bölümde (Trakeal entübasyon bölümü) bir cümle dikkatimi çekti. Olabildiğince düzgün çevirmeye çalışayım: “Ketamin sedatize ve ventile edilen hastalarda kafa içi basıncını artırmaz; bununla birlikte bazı çalışmalar ilacın olası serebroprotektif etkileri olduğunu da öne sürmektedirler. Ketaminin, hipotansiyonu olan kafa travmalı hastalarda uygulanması düşünülmelidir.” Her iki cümle de 14 numaralı referansla sonlanmaktaydı. Kitabın başka bir yerinde de benzer bir referansa dayandırılarak, ketaminin önceki tartışmalara rağmen “artık” güvenilir olduğundan bahsediliyordu.

Tintinalli’nin daha önceki baskılarını bilerek kabaca bir mukayese yapma şansına sahip olanlar iyi bilirler: Bu kitabın 6. baskısı muğlaklıkları, tam bir şey söyleyecek gibi olup da bir şey söyleyememesi ile ünlüydü. Bu nedenle 7. baskıdaki “şunu yapın”, “bu böyle tedavi edilir” gibi keskin yargılar sunması çoğu klinisyenin hoşuna gitmişti. Fakat biliyoruz ki, tıp aynı zamanda belirsizliğin sanatıdır… 2011 yılında bu cümleleri okuduktan sonra ilk işim 6. baskı Tintinalli’ye bakmak oldu: Trakeal entübasyon bölümünü açtığımda, yazıda açıkça ketaminin kafa içi basıncı artırabileceği ve bu nedenle kafa travmalı hastalarda ketaminden kaçınılması gerektiği belirtiliyordu. Demek ki geçen 4-5 yıl içinde büyük bir araştırma yapılmış ve 7. baskı Tintinalli’de 14 numaralı kaynak olarak referanslandırılmıştı. Sonraki işim 14 numaralı referansın ne olduğuna bakmak oldu.

Bu makale Sehdev ve arkadaşları tarafından Emergency Medicine Australasia’da 2006 yılında yayınlanmış olan bir derleme makaleydi. Bu derlemede kısaca; ketaminin intrakranial basınç artışına (KİBA) neden olmasıyla ilgili düşüncelerin 1970’lerdeki hayvan çalışmalarına dayandığı, bunların çoğunda da ketaminin aslında BOS akış yolunun önünde engeller bulunan hastalarda advers etkilerini gösterdiği, günümüzde insan çalışmalarında ketaminin bu şekilde kafa içi basınç artışını gösteren herhangi bir yayının bulunmadığı, bu konuda yapılacak olan insan çalışmalarına ihtiyaç olduğu belirtiliyordu. Yani KİBA’ya neden olduğunu gösteren kanıt yoktu ve artık kullanabilirdik. 5 yıl önce kullanamazdık, ama şimdi kullanabilirdik. Neden? Çünkü Sehdev ve arkadaşları bu konuda bir derleme yazmışlardı 🙂

Bu uzunca girizgahtan yılmayıp yazımı buraya kadar okuyabildiyseniz şunu söyleyebilirim: Kaynaklar ve kaynakçalar önemlidir. Yaz aylarının başında SCI hakkındaki yazımda da sizlere SCI isimli indeksin aslında bir atıf indeksi olarak başladığından bahsetmiştim. Acil tıp alanında uygulamalarının neredeyse altın standartını belirlemekte olan bir “text-book”, sistematik olmayan bir derlemenin sonuçlarına dayanarak varolan bir uygulamanın değiştirilmesi gerektiğine karar vermiş ve ters yönde bir uyarıda bulunmuştu. 

Kitap yazmak oldukça değerli bir akademik eylem olsa da, sebep olabileceğiniz durumlar açısından bakıldığında oldukça tehlikelidir de.. Tıpta herhangi bir disiplindeki bir uygulamanın “yap-yapma” şeklindeki dönüşümü için büyük kohort çalışmalar, büyük randomize klinik çalışmalar ve bu araştırmalardan türetilen meta-analizler & sistematik derlemelere ihtiyaç vardır. Branşların ana kitapları, var olan yeni klinik durumlardan ve trendlerden okurlarını mahrum etmemek için bu çalışmalara atıfta bulunurlar; elde hiç kanıt yoksa da tartışmalı başlıklara ait çalışmaları ortaya dökerek “elimden gelen budur” derler. Bir konuda kanıta dayalı olsun ya da olmasın, geleneksel önerinin tersine bir görüş beyan edilecekse bu görüş literatürden olgu sunumu düzeyinde dahi olsa desteklenmiş olmalıdır.

Kime Atıf?

Tıp literatürü gitgide her derde deva bulacağınız bir cangıla dönüşme sürecindeyken; akademik yazınızda, makalenizde ya da tezinizde sizi destekleyen ya da desteklemeyen yayınları bulmak oldukça kolay. Bu yüzden literatür taraması yapabilmek ve seçenekleri filtreleyebilmek gitgide daha fazla önem kazanıyor. Tezinizde, makalenizde ve hatta sunumunuzda; A ilacı “artık” B durumunda verilebilir gibi bir yargı cümlesi kullanacaksanız, bunu dayandırdığınız referans ancak bir textbook, yeni çıkan bir kılavuz ya da önemli bir makale olabilir (kaldı ki bir textbook’un dahi ne kadar zayıf kalabildiğine yukarıda değindim). Ne yazık ki bu referanslandırma işini FOAM siteleri, acilci.net ve hatta Medscape/UptoDate gibi yerli yerine oturmuş web sitelerinden de yapmamalısınız. Çoğu FOAM sitesinin sizi güncel bilgiye hızlı bir şekilde ulaştırdığı doğru olsa da, araştırmalardan edinilen bilgilerin bir textbook’un sayfaları arasına girene kadar defalarca test edildiğini hatırlamamız gereklidir. Modern tıp; ne yazık ki “ben çene redüksiyonu için şu metodu buldum” diyen birine şüpheyle yaklaşır, “buldum” dediği şey bir hasta üzerinde denenmiş ve başarıyla sonuçlanmış bir metot olsa da, yüz hasta üzerinde denendiğinde ne olacağı bilinmemektedir. Bu bakış açısıyla yaklaştığınızda, burun deliklerinden fiberoptik sokarak kendini entübe etmeye çalışanların, “dağdan topladığım göberekotu baş ağrıma iyi geliyor” diyenlerden farkı yoktur.

Literatür taramasını iyi bilen bir hekim, bir bilgi güncel mi değil mi korkusunu yaşamaz. Literatürü tarayabilmek, bilgiyi hızlıca doğrulayabilmek ve yalanlayabilmek imkanı sağlar. Yazdığım makalelerde bilgilere kaynaklar eklerken daima esas bilginin geldiği noktayı bulmaya çalışırım. Örneğin makalenizde “hızlı ardışık entübasyonun” acil serviste havayolu yönetimi için altın standart bir yöntem olduğunu vurgulayacaksanız, atıfta bulunmanız gereken yer RSI’ya ait 1980lerdeki ana makaleyi bulmaktır. Eğer burada 2019’da yazılmış olan RSI ile ilgili herhangi bir derlemeye atıfta bulunursanız, bir “kulaktan kulağa” oyununu başlatmış olursunuz. Bu oyuna kendi literatür taramalarım sırasında defalarca tanık oldum; zamana yayılmış ve sayıca artırılmış bir örneğini aşağıda sunayım hemen: 

  1. Olgu sunumu: RSI sırasında X ilacını uyguladık ve faydalı oldu
  2. Olgu sunumu: RSI sırasında X ilacını biz de uyguladık, faydalı oldu
  3. Derleme: RSI sırasında X ilacının uygulandığı durumlar mevcuttur (Referans: 1 ve 2)
  4. Orjinal araştırma: Hastaların %10’una RSI sırasında X ilacı da uygulanmıştı, sorun olmadı
  5. Derleme: RSI sırasında X ilacı güvenle uygulanabilir (Referans: 3 ve 4)
  6. Textbook: RSI sırasında X ilacı uygulanabilir (Referans: 5)
  7. Orjinal araştırma: RSI sırasında X ilacı kullananlarda mortalite yükseliyor, ama örneklemimiz yetersiz
  8. FOAM blogları: X ilacını hiçbir yerde kullanmayın, çok zararlı

Yukarıda saydığım ve aslında bilimsel temeli oldukça zayıf olan dizgenin, 1970lerden günümüze sayısız uygulama ve ilaç için değişikliğe uğradığını görebilirsiniz. Günümüzde mucize ilaç sınıfından, eh işte işe yarıyormuş düzeyine inen ilaçların çoğunda buna benzer bir seyir sözkonusudur. Bu dizgedeki hatanın temelinde referanslandırma kurallarına uyulmaması, yanlış çalışmaya atıf verilmesi, atıf verilen yazının kanıt değerinin anlaşılamaması gibi birçok nokta mevcuttur. Kulaktan kulağa oyununun sorunlu başka bir yönü de yanlış alıntılamanın veya alıntının anlaşılamamasının gerçekliğe dönüşmesidir.

  1. Orjinal araştırma: Troponin düzeyi, düşük riskli pulmoner tromboemboli hastalarında mortalitenin predikte edilmesi açısından düşük tanısal başarıya sahiptir.
  2. Orjinal araştırma: Troponin düzeyi, pulmoner tromboembolide mortalitenin predikte edilmesi açısından düşük tanısal başarıya sahiptir (Kaynak 1).
  3. Orjinal araştırma: Zaten kardiyak belirteçlerin, pulmoner tromboemboli tanısında işe yaramadığı bilinmektedir (Kaynak 2).
  4. Tıpta uzmanlık tezi: Pulmoner tromboembolide herhangi bir kardiyak belirteç istenmesi gerekmez, çünkü işe yaramamaktadırlar (Kaynak 3). 

Atıflar daima birincil çalışmaya yapılmalıdır. Birincil çalışmanızın tarihi çok eskilere de dayansa ve hatta dergi sizden olabildiğince güncel çalışmalara atıf vermenizi de istese, eğer temel bir bilgiyi referanslandırmak derdindeyseniz yine de o 1969’da yapılmış araştırmaya atıfta bulunmalısınız.

Neden Atıf?

Daha önceki yazılarımızda da bu konunun üstünde durduğumuzu hatırlıyorum: Artık günümüzde kimse tekerleği veya ateşi keşfetmiyor, elmalar Newton’ın kafasına düşmüyor. Bilim sürekli geçmişten öğrendikleriyle sarmalanan bir çığ şeklinde ilerliyor. Bu kocaman yapıya bir tuğla büyüklüğünde bir katkınız olsun istiyorsanız; hem tuğlayı doğru yere yerleştirmelisiniz, hem de tuğlanız yapıyı çökertmeyecek dayanıklılığa sahip olmalı.. 

Yüzbinlerce kişiyle yapılmış araştırmalar bir tarafta dururken, benim yazacağım bir olgu sunumu neyi değiştirebilir ki diye soruyorsanız yanılıyorsunuz. 1950lerde sıkça reklamı yapılan ve gebelerde bulantı-kusma için tercih edilen talidomidin tahtı bir olgu sunumuyla yıkılmıştır. Bununla birlikte tıp tarihi, birçok orjinal çalışmayla test edilmiş, fakat metodolojik olarak bazı hasta gruplarını kapsamamış, bu nedenle bariz bir gerçeği atlamış makalelerle doludur. 1920lerde doktorlar tarafından bile kullanılması önerilen sigaranın, akciğer kanseriyle ilişkisinin saptanması bir klinik çalışmanın sonucudur. Günümüzde farklı metodolojiyle ele alındığında bizi bambaşka sonuçlara götüren araştırmaların planlanmasının nedeni de tam olarak budur. “Tereyağı yararlıymış, hayır sarısı faydalıymış, beyazı daha iyiymiş, günde 4 yumurta yiyeceksin” gibi çelişkili sonuçlara ulaşan makalelerin sürekli fikir değiştirir halde görünmesinin sebebi de kullanılan farklı metodolojilerdir. Paragraf

Makalenizde veya sunumunuzda hiç kimse atıflarınıza bakmaz. Eğer genel bilginin aksine bir görüş iddia ediyorsanız, o zaman dedikleriniz ve kaynaklarınız didik didik incelenir. Günümüzde her türlü iddianın dayanacağı bir araştırmanın/olgu sunumunun bulunması mümkündür. Hastanın dişlerini sıkarak omuz redüksiyonu yapılmasını öneren makalelere de ulaşabilirsiniz örneğin.. Bu nedenle atıf vermeden önce birkaç tane olmazsa olmazı sıralayarak, kısa bir özetle bitirelim:

  • Mutlaka ana fikrin çıktığı esas makaleye atıfta bulunun
  • Makalenizin atıf sayısının artması için gereksiz atıflarda bulunmayın
  • Herhangi bir konudaki ana akım görüşe ters bir beyanda bulunacaksanız, bu beyanı dayandıracağınız makalelerin özelliklerini (ve zayıf/güçlü yönlerini) kısaca belirtin
  • Önceki yazılarınıza (kendinize) atıfta bulunabilirsiniz, fakat abartmayın  
  • Atıfta bulundunuz makaledeki “context”i anlamaya çalışın, bağlamından koparılmış bir cümle kolayca yanlış anlamalara neden olabilir.
  • Eğer atıfta bulunacağınız belge bir kılavuz, sistematik derleme, meta-analiz ya da başka bir orijinal çalışmaya ait değilse çok daha dikkatli davranın. Özellikle düz derleme makalelerine (narrative review) atıfta bulunmamaya çalışın.
  • Özellikle FOAM sitelerinden gelen “şunu yap”, “artık bu iş böyle” tarzındaki bilgilere şüpheyle yaklaşın, kaynak makalelerine bakın. 
  • Belki de hepsinden önemlisi: Literatür taramayı öğrenin. Elinizde bir harita yoksa çok daha kolay kaybolursunuz.
6 Şubat 2020 0 comments
0 FacebookTwitterPinterestEmail
Araştırma planlama yazılarıTATDakademik

Anket Çalışması Planlarken

by Gökhan Aksel 6 Şubat 2020
written by Gökhan Aksel

Anket çalışmaları kendi alanımızda olduğu gibi pek çok alanda da karşımıza çıkan çalışma tiplerinden birisi. Akademik ilerleme sürecinde dosya doldurma baskısı düşünüldüğünde hızlıca yapılabilmesi, geniş örneklemlere kısa sürede zahmetsiz şekilde ulaşılabilmesi gibi nedenlerle araştırmacılar anket çalışmalarını sıklıkla tercih etmektedirler. (E-posta kutunuza düşen anket çalışmalarının sayısından tahmin edebilirsiniz bunu). Ancak bu sayısal çoğunluğa rağmen bu anketlerin önemli bir kısmı aslında özensiz hazırlanmış, geçerlilik ve güvenirlilik analizleri yapılmış net bir ölçek içermemektedir.

Aslında anket çalışmaları gözlemsel araştırma alt tiplerinden birisidir ve kesitsel-tanımlayıcı bir çalışma tipi olarak kategorize edilebilir. Anket çalışmalarının diğer çalışma tiplerine göre en önemli güçlü yönü normalde direk ölçülebilir olmayan insan düşüncüleri, tutumları, bir durum karşındaki inanış ve davranış şekilleri gibi soyut başlıkları ölçülebilir hale çeviren ve böylelikle bilimsel çıkarımlar yapmamızı sağlayan ölçümler sağlamalarıdır. Ancak bu anket çalışmalarının hepsi için geçerli değildir. Genel olarak anket çalışmaları kalitatif ve kantitatif olarak ikiye ayrılmaktadır. Kalitatif anket çalışmalarında standart bir ölçüm bulunmamaktadır. Dolayısıyla istatistik yapılacak matematiksel veriler elde edilememekte sonuç  itibariyle evrene genellenememektedir. Bu tip çalışmalar daha çok ticari kuruluşların – şirketlerin kendi müşterileri hakkında hızlıca bilgi alıp pazarlama yöntemlerini belirleme veya belirli bir kurum – şirketin çalışanlarına yönelik belirli bir sorun hakkında görüşlerini toplayıp yönetsel iyileştirmeler yapmaları için kullanılmaktadır. Sorular açık uçlu olabileceği gibi çoktan seçmeli ölçeklerde kullanıyor olabilir. Ancak çoğu durumda bu ölçeklerin geçerli bir bilimsel karşılığı bulunmamaktadır. Maalesef özensiz hazırlanan anketlerin pek çoğu kalitatif olmanın ötesine geçememektedir.

İkinci tip anket ise kantitatif anket çalışmalarıdır. Kantitatif çalışmalarda kullanılan ölçekler sayesinde yukarıda bahsi geçen normalde ölçülebilir olmayan soyut durumlar ölçülebilir hale dönüştürülmektedir. Ölçüm bizim için çok önemlidir. Çünkü genel geçer ilk kuralımız bilim ölçüm demektir. Ölçemediğimiz ve sayısal olarak ifade edemediğimiz hiçbir parametre hakkında bilimsel çıkarım yapamamaktayız. Ama bu kadarı da yetmemektedir. Ölçüm dediğiniz anda ölçeğinizin geçerli olup olmadığı ve güvenilir olup olmadığı sorusu karşımıza gelmektedir. Bozuk tansiyon manşonu ile 10 kez tansiyon ölçümü yaptığınızı düşünün. Bu hastanın gerçek tansiyonu 120/80mmHg olsun. Siz bu tansiyon ölçümleri sonucunda birbirinden farklı 10 adet sonucu elde ediyorsanız geçersiz ve güvenilir olmayan bir ölçeğiniz var demektir. Bu yaptığınız ölçümlerin hepsinde 180/110 gibi yanlış ama hep aynı sonucu alacak şekilde ölçüm yapıyorsanız bu durumda da güvenilir olan ama geçersiz bir testiniz var demektir. (Şekil-1).

İşte aynı durum anket çalışmasında kullandığınız ölçek içinde geçerlidir. Siz bir konu hakkında araştırma yapmak istiyorsanız ve size göre mantıklı gelen 20 soruluk bir anket oluşturuyorsunuz. Ancak bu 20 sorunun tam olarak neyi ne kadar ölçtüğü konusunda hiçbir kanıt bulunmamaktadır. Bu şekilde yapılacak bir çalışmanın yine kalitatif olmanın ötesine geçme şansı bulunmamaktadır.

Bu anlamda eğer bir araştırmacı anket çalışması planlarken ölçek geliştirmek gibi bir amacı (ki bu iş uzmanlarına bırakılması gereken oldukça uzun bir süreç) yoksa kendi sorusuna yönelik daha önce geliştirilmiş güvenirlik ve geçerlilik analizleri yapılmış ölçekleri araştırıp bulup kendi çalışmasında kullanması en mantıklı yoldur. Bunun için kullanılabilecek kaynaklardan birisi Türkiye ölçme araçları dizinidir (https://toad.halileksi.net/olcek). Bu dizinde şuan itibari 7069 adet ölçek bulunmaktadır.

Bu basit kurallara dikkat edilmeden yapılan araştırmalar sonucunda genellikle sonuçları açısından evrene genelleme yapılamayan, başka sonuçlar ile karşılaştırılamayan, bilimsel değeri oldukça düşük ve pek çok derginin kabul etmeyeceği bulgular elde edileceği unutulmamalıdır.

İyi okumalar…

6 Şubat 2020 0 comments
0 FacebookTwitterPinterestEmail
Makale yazımı yazılarıTATDakademik

Klinik Araştırmacının Temel Kaynakları

by Haldun Akoğlu 5 Şubat 2020
written by Haldun Akoğlu

CARE Kılavuzu – Vaka Bildirisi Yazım Kılavuzu

(The CARE Guidelines: Consensus-based Clinical Case Reporting Guideline Development)

  • CARE Kılavuzu – İngilizce
  • CARE Kılavuzu Kontrol Listesi – İngilizce
  • CARE Kılavuzu Kontrol Listesi – (Türkçe) [Doç. Dr. Haldun Akoğlu tarafından çevrilmiştir]
  • CARE Kılavuzu Akış Şeması 2013-01F – İngilizce

Advers Olay Bildirimi Kılavuzu

Guidelines for submitting adverse event reports for publication


STARD Kılavuzu

Testlerin Tanısal Doğruluklarını İnceleyen Çalışmalar için Kılavuz

http://www.stard-statement.org/

  • STARD 2015 Tam Metin Açıklayıcı Döküman
  • STARD 2015 Kontrol Listesi (İngilizce) PDF Word
  • STARD 2015 Akış Şeması (İngilizce)
  • STARD Konferans Abstraktları için (Cohen 2017 BMJ)

STARD Kılavuzunun Hikaye ve Fizik Muayene Çalışmalarına Uygulanması​2​

Simel – Application to the History and Physical Examination


CONSORT 2010 Kılavuzu – Paralel Gruplu Randomize Çalışmaların Bildirimi Kılavuzu​3​

  • http://www.consort-statement.org/
  • CONSORT Kılavuzu Tam Metin
  • CONSORT 2010 Akış Şeması TÜRKÇE
  • CONSORT 2010 Checklist_TÜRKÇE

STROBE Kılavuzu – Gözlemsel Çalışmaların Bildirimi Kılavuzu​4​

  • http://www.strobe-statement.org/
  • STROBE Kılavuzu Tam Metin (İngilizce)
  • STROBE_checklist_Konferans Bildirileri için (Abstrakt) (İngilizce)
  • STROBE_checklist_v4_Vaka Kontrol Çalışmaları (İngilizce)
  • STROBE_checklist_v4_Kohort Çalışamalar (İngilizce)
  • STROBE_checklist_v4_Toplu (İngilizce)
  • STROBE_checklist_v4_Kesitsel (İngilizce)

  • STROBE_checklist_v4_Toplu_Türkçe (Türkçe resmi çeviri) [Prof. Dr. Zekiye Karaçam] (YENİ)
  • STROBE_Revizyon_11 Mart 2014 (Türkçe resmi tam metin) [Prof. Dr. Zekiye Karaçam] (YENİ)
  • STROBE_kontrol listesi_v4_Toplu – Türkçe (Türkçe) [Doç. Dr. Haldun Akoğlu tarafından çevrilmiştir]

PRISMA – Sistematik Derleme ve Meta Analizler için Kılavuz

  • Preferred reporting items for systematic review and meta-analysis protocols (PRISMA-P) 2015: elaboration and explanation – 2015​5​
  • PRISMA-P – Checklist – 2015
  • http://www.prisma-statement.org/statement.htm
  • PRISMA for Abstracts – Reporting Systematic Reviews in Journal and Conference Abstracts​6​

GRRAS – Güvenilirlik ve Uygunluk Çalışmaları Bildirimi Kılavuzu

  • Guidelines for reporting reliability and agreement studies (GRRAS) were proposed​7​

ARRIVE Kılavuzu

Animal Research: Reporting of In Vivo Experiments

Hayvan çalışmalarının bildirilmesi konusunda hazırlanmış bir kılavuzdur.

  • Arrive kılavuzu
  • Arrive kılavuzu – checklist
  • Arrive kılavuzu – örnek
  • Arrive kılavuzu – sunum

Çıkar Çatışmaları, Etik, Yazar Olma Kuralları Kılavuzları

ICMJE: Uniform Format for Disclosure of Competing Interests in ICMJE Journals. Updated July 2010.

  • ICMJE – Disclosure 2010

International Society for Medical Publication Professionals Code of Ethics.

  • http://www.ismpp.org/ethics

AMWA position statement on the contributions of medical writers to scientific publications

  • AMWA_PositionStatement_Contributions

European Medical Writers Association (EMWA) guidelines on the role of medical writers in developing peer-reviewed publications

  • EMWA guidelines

Faydalı İstatistik Kitapları, Programları ve İnternet Siteleri

Kitaplar

  • Discovering Statistics Using SPSS / SAS / R – Prof. Dr. Andy Field istatistik anlatımını bambaşka bir boyuta geçirerek bu kitaplarla benim vizyonumu açtı desem hiç de yanlış olmaz. Piyasada yer alan hemen hemen tüm Temel İstatistik kitaplarını almış biri olarak anlatım duruluğu, merak eden için ayrıntıya girmesi, işin özünü size vermeye çalışması ve görsel olarak dolu dolu herşeyi anlatmasıyla bence bir klinik araştırmacı için en iyi istatistik kitabı.
  • Introduction to Meta-Analysis (Statistics in Practice) – Borenstein’in klasik kitabı. Okuması kolay. Ancak aşağıda tanıttığım Comprehensive Meta Analysis programı temel alınarak anlatım yapıyor. En temiz ve anlaşılır metinlerden biri. Formülleri okumayıp direk atlamak en doğrusu 🙂

Yazılımlar

Power Analizi ve Örneklem Büyüklüğü Hesabı

  • GPower [Bedava / Windows – Mac] Benim bu yönde tüm ihtiyacımı karşılıyor. Daha iyi bir alternatif bulamazsınız. Hem de bedava.

Meta Analiz

  • Meta-DiSC [Bedava / Windows] Meta analiz için TP, TN, FP, FN girerek hem grafik çizebilir gem de meta analiz gerçekleştirebilirsiniz.
  • MIX [Ücretli / EXCEL add-on] EXCEL üstünde çalışan son derece kapsamlı bir meta analiz programı. Her türlü grafiği de çizmeniz mümkün. Çoğu programı denedikten sonra ben bunda karar kıldım. Sahiplerine yazarak Türkiye için daha düşük bir ücret talebinde bulunabilirsiniz.
  • Comprehensive Meta Analysis [Ücretli – 10 gün tam deneme sürümü] Tam kapsamlı ve ayrı çalışan bir meta analiz programı. Borenstein’in “Introduction to Meta-Analysis (Statistics in Practice)” kitabıyla birebir uyumlu hazırlanmış. Deneme sürümüyle bile son derece etkin çalışmalar yapabilirsiniz.

Paket Programlar

  • JAMOVİ: R tabanlı bir grafik arayüz. Tamamen ücretsiz. Artık hemen hemen tüm analizlerimizde bu yazılımı kullanıyoruz.
  • R [Ücretsiz / Windows – Mac ] R bir proje [http://www.r-project.org/] Ücretsiz bir paket ama çok güçlü. Öğrenme eğrisi biraz dik ve zaman alıyor. Sağlık araştırmacıları arasında pek de popüler olmayan Stata gibi metin temelli bir arayüzle çalışıyor. Ama giderek eklenen parçalarla tamamen görsel bir kullanıcı arayüzü de oluşturulabiliyor. Denemek isteyenler Andy Field’in “Discovering Statistics using R” kitabını alıp öyle başlamalı.
  • SPSS [Ücretli / $$$$$ / Windows – Mac ] Her ne kadar sosyal bilimler için tasarlanmış bir paket olsa da yıllardır en çok kullanılan paket. Alışkın olmak belki de en önemli kullanım sebebi. Satın almaya gücünüzün yetmeyeceği aşikar bir paket. Üniversitenizin toplu aboneliği yoksa yayınlarınızda Metod bölümünde atıf yaparken bir daha düşünmelisiniz.
  • MedCalc [Ücretli / $$  / Windows ] Hem sağlık bilimlerine yönelik olması hem de kullanım kolaylığı ile giderek popülerleşen bir paket. Satın almaya gücünüzün yetecek olması ve kurslarıyla beraber programın bedava verilmesi seçeneği de cabası. Ancak satın alırken güvende kalmak için mutlaka internet üzerinden ve orjinal http://www.medcalc.org/ sitesinden satın alın. Satın almış bir kullanıcı olarak ben giderek daha sık MedCalc kullanıyorum. Görsel grafik çizim seçeneklerinin bir süre daha geliştirilmesine ihtiyacı var.  Ayrıca deneme sürümü tam sürüm ve bu sürümle yaptığınız çalışmalarda MedCalc’i referans olarak gösterebilirsiniz (Belçika merkezli şirketle birebir yazışarak bu konuyu doğrulattım, Türkiye’de aksini iddia eden bir distribütör var kulak asmayın).

Online Siteler

  • Research Randomizer [Bedava / Online] Hastaları gruplara atamak için random sayılar tablosu yerine bu online programcık tüm işinizi görecektir. Son derece yeterli.
  • Vassarstats.net [Bedava / Online] Olağanüsü bir online istatistik hesaplayıcısı. Soldaki menülerde yer alan “Clinical Research Calculators” içerisinden “Calculator 1” ile 4 gözlü bir tablodan duyarlılık, özgüllük, pozitif ve negatif prediktif değer, likelihood ratio ve hepsinin %95 güven aralıklarını hesaplayabilirsiniz. Bu özellik paket istatistik programlarında dahi yok. Bunun dışında paket programlarda yer alan ama son derece kenara köşeye saklanmış testler burada hemen önünüzde. STARD kılavuzuna ihtiyacınız olan her çalışmada mutlaka vassarstats da kullanmanız gereklidir diyebilirim.
  • Statistics Hell – Ünlü “Discovering Statistics” serisi kitaplarının yazarı Prof. Dr. Andy Field’ın şahsi istatistik eğitimi sitesi. “Statistics Hellp” kısmında hemen hemen tüm konularla ilgili dersler ve örnekler yer alıyor. Ayrıca Youtube üzerinde derslerini de izlemek mümkün. Bence klinik bioistatistiğin Amal Mattu’su.

Uygun İstatistik Testinin Seçimi

Temel ve Klinik Biyoistatistik kitabında yer alan uygun testin seçimine yönelik akış şemalarını özel bir sayfada uygulamalı hale getirdik. Bu sayfaya aşağıdaki linkten ulaşabilirsiniz.

Uygun istatistik test seçim algoritmaları

Uygun test seçim algoritması sitemizdeki İstatistik Hesap Araçlarında mevcuttur. Dilerseniz BURADAN da ulaşabilirsiniz.



Son Söz

Dünyayı yeniden keşfetmeye gerek yok. Eğer hatırı sayılır bir dergide yazınızı yayınlatmak istiyorsanız bu kılavuzlara uygun olarak yazınızı hazırlamış olmanız beklenir. Çünkü hakemler ve editörler bu kılavuzları esas alırlar.

Önce kafanızda bir soru oluşmalı, cevabını aradığınız bir hipoteziniz olmalı. “Pnömotoraksla gelen tüm hastaları toplamak” bir klinik araştırma sorusu değildir. “Pnömotoraksla gelen hastaların değerlendirmesi ve literatürün gözden geçirilmesi” başlıklı bir yazının istediğiniz kalitede bir dergide yayınlanma ihtimali neredeyse sıfırdır. “Pnömotoraks hastalarında travma mekanizmasının pnömotoraks hacmiyle ilişkisi” ise belki de tamamen aynı verilerle sonuçlandırılabilecek daha net bir klinik soruyu soran bir araştırma olacaktır. Sorunuz, nettir: “İlişki (association) var mı?” Sonucunuz da net olacaktır: Var ya da Yok. Bu şekilde net bir soru oluşturunca, hipotezinizi ve amacınızı yazacaksınız. Lehte ve aleyhte benzer çalışmaları okuyup sonuç ve amaçlarını özetleyeceksiniz. Çalışmanızın metodunu yazacaksınız. Gözlemsel olacağından STROBE kılavuzunu açıp ona göre her yerini tamamlayacaksınız. Ardından, tüm bunlardan sonra, hastalarınızı metodolojiye uygun şekilde toplamaya başlamalısınız. İnanın belki de toplamda hem harcayacağınız efor daha az olacak hem de bir klinik çalışmanın yapılması aşamalarını doğru şekilde tatbik etmiş, birsürü eksiğinizi görmüş ve düzeltmiş, yayınlatılma ihtimali daha fazla bir yazıya doğru ilerliyor olacaksınız.

Klinik araştırma, vaka sunumu, bildiri ya da meta-analiz yazıları hazırlamanın aslında en önemli ve ilk basamağının planlama olduğunu herkes bilir ama çok az kişi uygular. Bir klinik araştırma yazısının neredeyse 2/3’ü daha hasta toplanmadan aslında yazılmış olmalıdır. Bunu yaparken de uygun metoda göre aşağıda yer alan kılavuzlardan faydalanılır. İşte bu planlama, hazırlık yazımı ve kılavuzlara uygun şekilde yazım basamakları, aynı metod ve hasta sayısına sahip çok benzer iki yazıdan birinin 10 impakt faktörlü dergide yayınlanırken diğerinin tüm hakemlerden red yemesini sağlayan esas farktır. “Türkiye’den giden yazıları reddediyorlar” mitinin arkasında yatan gerçek aslında “Türkiye’den giden yazılarda Uluslararası kabul gören yazım ve sonuç bildirimi kılavuzlarına uyulmaması”dır. Metodolojisi belirsiz, kılavuzlara uygun yazılmamış, kıt İngilizcemizle “bir gönderelim de onlar reddetsin” mantığıyla gönderdiğimiz yazılarımızdan hüsrana uğramamız kesinken; metodolojisi hasta toplamadan netleştirilmiş, alım ve çıkarma kriterleri net, hipotezi olan, istatistik testleri doğru seçilmiş ve ayrıntısıyla açıklanmış, yazım kılavuzlarına uygun, bir İngilizce profesyonelince çevrilmiş ve dili kontrol edilmiş yazılarımızda şansımız çok daha yüksektir.

30 yıl eskide kalmış, herhangi bir hipotezi test etmeyen, metodu olmayan, sadece demografik verilerin yüzdelerini sıralayan, kılavuzlarla uzaktan yakından alakası olmayan “demografik veri sunumları” ve “literatürün gözden geçirilmesi” yazıları ancak hiç yapılmamışsa, ya da çok büyük bir kohortu tanımlıyorsa faydalı olabilir. 30 kere yapılmışı tekrarlayan bu tip yazıların akademik camialarımızın ilerleyişinde en büyük handikap olduğu inancındayım.

5 Şubat 2020 0 comments
0 FacebookTwitterPinterestEmail
İstatistik yazılarıTATDakademik

P değeri ve Güven Aralıkları: Anlatılmaz, yaşanır

by Haldun Akoğlu 5 Şubat 2020
written by Haldun Akoğlu

1920’lerde Fisher p degeri’ni tanımladığında birgün bu kadar yanlış anlaşılacağını bilseydi herhalde matematiği bırakıp inzivaya çekilirdi. P değeri ve anlamı günümüzde akademik dünyanın açık ara ile en büyük ve en yaygın yanlış anlaşılmasıdır. Bu yanlış anlaşılma hatta anlaşılamama durumunu bir nebze hafifletmek amacıyla hayali bir çalışma kurguladım. Sizlerle beraber bu çalışmanın verileri üzerinde oynayarak p değeri ve güven aralıklarının gerçek hayatta neler ifade ettiğini anlamaya çalışacağız. Anlaşılmaz istatistiksel kavramlardan uzak durmaya gayret etsem de çok başarılı olamadığım yerler de oldu. Bu açığı deva eden yazılarla kapatmaya çalışacağız. Eğer yarım saatinizi vermeye hazırsanız, başlayalım…

İlk çalışma: bir erkeğin anatomisi

Chris-Evans-Shirtless-Captain-America-Hairy-Chest-600x445

Bir grup araştırmacı, erkek asistanların kadın asistanlar tarafından beğenilmelerinde yeni trend olan sakal bırakmanın etkisini incelemek üzere bir araştırma planlarlar (konu üzerinde fazla düşünmeme gerek kalmadı, çünkü tüm asistanların birden 2 karış sakalla gezmeye başlamasında 20’li yaş grubu için ilk hipotez daima karşı cinsle ilgili olmak durumundadır. Mesela durduk yere nöbet değişmek, rotasyona çıkmak için aşırı heveslenmek, nöbeti yokken hastanede görünmek gibi). Farklı hastanelerde farklı ihtisas dallarında asistanlık yapan erkekler yaş, boy, kilo gibi faktörler açısından stratifiye edilmiş gruplar içine kurumlar ve ihtisas dalları arasında fark olmayacak şekilde örneklendikten sonra (226 erkek asistan) sakal bırakan (n=112) ve her gün tıraş olan (n=114) gruplarına randomize edilirler (dolayısıyla “sakal bana yakışıyor abi” diyenlerle eskikız arkadaşı beğendi diye bırakıp sonra vazgeçemeyenlerden kaynaklanan biası minimize etmeye çalışıyoruz). Sıfır hipotezimiz sakallılar ile sinekkaydılar arasında fark olmadığı, alternatif hipotezimiz ise birinin daha çekici olduğu şeklinde. Çalışmanın birincil sonlanım noktası (hedefimiz) aynı şekilde örneklenmiş kadın asistanlar tarafından 10 üzerinden bu erkek asistanların çekiciliklerinin puanlanması, toplu ortalamalarının alınması ve her erkek asistanın buna göre çekici ya da değil olarak sınıflandırılması sonrasında sakal grupları arasındaki farkın incelenmesidir (bu değerlendirme elbette subjektif bir ölçümün kantitatif veriye dönüştürülmesi olduğundan kendi içinde yanılgı payı var. Ancak sosyologlar çekiciliğin aslında subjektif olmadığını, çekici olan kişiler üzerinde herkesin hemfikir olduğunu, eğer hemfikir değillerse o kişinin çekici olmadığını belirten çalışmalar yapmışlar). Sonuç olarak her gün tıraş olan asistanlar içerisinde çekici olarak tanımlananların sayısı daha fazla olsa da aradaki fark istatistiksel olarak anlamlı bulunmamıştır (sakal bırakanlar: 33/112 (%29,4) – tıraş olanlar: 41/114 (%35,9); P=0,32) (Burada da aslında bir bias var, çekici olan sakal bıraksa da bırakmasa da çekicidir. Ama zaten bu sebeple grupları randomize ettik, iki gruba da eşit sayıda Brad Pitt düşsün diye).

Buradaki p değerini aşağıdakilerden hangisi en iyi tanımlar?

a) Sıfır hipotezinin (sakal makal farketmez, önce bakarım adam mı diye) doğru olma olasılığıdır.

b) Alternatif hipotezin doğru olma olasılığıdır.

c) Araştırma yapılan gruplar arasında fark olmadığı sürece sonlanım ölçütünde gözlenen fark (%35,9-%29,4=%6,5) ya da daha fazlasını elde etme ihtimalidir.

d) Gözlenen fark (%6,5) ya da daha fazlasının şans eseri olma ihtimalidir.

[toggle title=”Cevap için tıklayın” state=”close”]En iyi yanıt C seçeneğidir.[/toggle]

1
Böyle çalışma mı olur diyenler için yayınlanmışını buradan ispat ediyoruz

Çalışmanın sıfır hipotezi örneklemin alındığı erkek asistanlar popülasyonunda sakal bırakan ya da her gün tıraş olan erkek asistanlar içinde, kadın asistanların puanlamasında çekici olarak belirlenen erkek asistan oranı açısından fark olmadığıdır (sakal makal farketmez). Alternatif hipotez ise iki yönlüdür. Ya sakal bırakanlarda ya da her gün tıraş olanlarda çekici olarak belirlenen erkek asistan oranı daha fazladır.

P değeri, sakal bırakan ve her gün tıraş olan erkek asistan gruplarında kadın asistanlar tarafından çekici olarak tanımlanan asistan oranları arasında gözlenen en az %6,5’lik farkın, aslında hiç fark olmamasına rağmen görülebilme ihtimalidir. Yani bu sayıda asistan kullandığımda %32 ihtimalle arada fark olmamasına rağmen en az %6,5 fark varmış gibi sonuç alabileceğimizi belirtir. Ki-kare testi kullanarak bulduğumuz p değeri tam olarak bu olasılığı ifade eder.

Verilerimizi hesaplama sitesinde yerlerine koyduk ve aşağıda yer alan ilk hesap tablosunu oluşturduk. Bu hesap tablosunun biraz ayrıntısına inelim: Her gün tıraş olanların 41 tanesi çekici iken (%35,9) sakal bırakanların 33’ü çekicidir (%29,4). Yani çekici olanların sayısı her gün tıraş olanlarda 1,22 kat (%35,9/29,4) daha fazladır. Her gün tıraş olan asistanların çekici olma odds’u (çekici olanların olmayanlara oranı) 0,56; sakal bırakanların çekici olma odds’u 0,41’dir. Bu iki odds arasındaki orana odds oranı denilir ve 1,34’dür (0,56/0,46). Bu ise her gün tıraş olanların çekici olma olasılığının sakallı gezenlerin çekici olma olasılığının 1,34 katı (ya da %34 daha fazla) olduğunu gösterir. Bu değerin hemen beraberinde bir de %95 güven aralığı gelir genellikle (otomatik olarak yazılım hesaplar bunu). %95 güven aralığı, eğer biz aynı kıstasları kullanarak aynı asistan evreninden 20 örneklem seçseydik 19’unda elde edeceğimiz sonuçların yer alacağı aralığın üst ve alt sınırlarıdır (95/100=19/20). Aynı veriye göre 20 farklı erkek asistan grubunu değerlendirirsek 19’unda çekici olma olasılıkları oranı 0,77 ile 2,35 kat arasında iken, 1’inde bu aralığın dışındadır (ilk tabloya bakalım). Yani 20’de 19 ihtimalle sinekkaydıların 1,34 kat olan çekici olma olasılık oranı, farklı bir örneklem alınırsa 2,35 kat’a çıkabilirken, tam tersine bir başka grupta sakalla gezenlerin çekici olma olasılığı 1,29 kat daha fazla çıkabilir (0,77 – 100/77=1,29). Sonuç olarak, elde ettiğimiz veriye göre sakallılar ya da sinekkaydılar daha fazla çekici olma olasılığına sahip demek mümkün değildir (matematiksel olarak odds oranının %95 güven aralığı içinde 1 yer alır, ya da sınırlardan biri 1’den küçükken diğeri büyüktür, yani oranlarının 1 olma ihtimali söz konusudur). Çalışma sonunda sakal kesmek ya da kesmemenin erkek asistanların çekiciliğine bir katkı sağlamadığı, önemli olanın iç güzellikleri oldukları yorumu yapılarak çalışma yayınlanır, çalışmaya istinaden de herkesin sakallarını kesmesi istenir.

Ekran Resmi 2015-05-18 21.42.38
Sakalsız asistan candır

Big Shave: Şeytani tıraş makinasi firma çalışması

2
İsviçreli bilimadamları laboratuvardaki tek yakışıklı teknisyeni denek olarak kullanmışlar

Ardından bir tıraş makinesi firması az buz erkek asistan olmadığı, iş-güç yüzünden 30’lu yaşlarına kadar bekar gezdikleri ve eğer erkek asistanların tıraş olduklarında daha çekici oldukları yönünde güçlü bir veri sağlayabilirse makine satışlarını patlatabileceği yargısına varır. A cihazıyla tıraş olmak (girişim-intervention) ya da tıraş olmamak (kontrol) gruplarına tamamen aynı demografik oranlarla erkek asistanları randomize ederler. Ama yatırım güçleri daha fazla olduğundan 226 erkek asistan değil de 2260 erkek asistanı çalışmaya alırlar. Şansa bakın ki çalışmanın tüm verileri birebir aynı çıkar. Aradaki fark yine %6,5’dir. Çekici olanların olmayanlara oranı (odds) ve tıraş olanlarla olmayanların çekici olma olasılıklarının oranı (odds oranı) da doğal olarak birebir aynıdır. Ancak bu sefer güven aralığı çok daha dardır. 20 farklı 2260 kişilik örneklemler alsaydım 19’unda çekici olma olasılıkları oranı 1,13 ile 1,60 kat arasında değişecek, ancak 1 seferinde ise bu aralığında da dışında olabilecekti (%95 güven aralığı, %5 ihtimalle yanılacağım anlamına gelir). Yani 20 seferin 19’unda öyle ya da böyle sinekkaydı ekibin içinde yer alan bir asistanın çekici olma olasılığı daha fazla diyebiliriz. Bu 20’de 1 tamamen yanılma durumuna (ki biz bu miktarda yanılmayı kabulleniyor ve %95 güven aralığı seçiyoruz başta, örnekleme hatası da denir. Eğer %5 size fazla geliyorsa %1 (%99 güven aralığı) yanılma payı da bırakabilirsiniz, ancak o zaman daha geniş bir aralık bulacaksınız). Hesapladığımız bir diğer değer ise P değeri olup 0,0012’dir. Aynı sayıda asistan kullandığımda arada fark olmamasına rağmen %0,12 ihtimalle en az %6,5 fark varmış gibi sonuç alabileceğimizi belirtir. Arada fark yokken hata yapıp en az %6,5 fark varmış gibi bulma ihtimalimiz neredeyse yoktur. Arada bulduğumuz farkın gerçekliğine güvenebileceğimiz anlamına gelir. Bu hesaplamayı da aşağıdaki tabloda görebilirsiniz.

Ekran Resmi 2015-05-18 21.45.45
Alçak tıraş makinası firması çalışması – kalabalıkların gücünü küçümsemeyin

Örneklemimiz küçük olduğundan fark bulamadık, biri paraya kıyıp daha geniş örneklem ile anlamlı fark bulacak ama fikir benden çıktı çalışması

hugh1
Allame-i cihan da olsanız şansınızı fazla zorlamayacaksınız

Şimdi işleri biraz karıştıralım. Çekici olarak tespit edilen asistan oranları şu şekilde olmuş olsun: sakal bırakanlar: 33/112 (%29,4) – tıraş olanlar: 33/114 (%28,9). Yani her iki grupta da aynı sayıda çekici asistanımız var ve oranlar da neredeyse aynı. P değerini hesapladığımızda tam 1 olduğunu görüyoruz (Yine aşağıdaki tablodan takip edelim). Peki bu ne demekti? Aynı sayıda asistan kullandığımda arada fark olmamasına rağmen %100 ihtimalle en az %0,5 fark varmış gibi sonuç alacağız demek (%29,4-%28,9=%0,5). Odds oranı 1,02 %95 güven aralığı ise 0,58 ile 1,82 arasında. Bu sonuç ise aynı sayıda asistan içeren tıpatıp benzer ama farklı 20 örneklem alsam 19’unda bir grubun diğerinden daha çekici olma miktarının yüzdesel olarak büyüklüğünün ters yönlerde %82 ile %72 (100/58) arasında değişebileceğini gösteriyor (1,82 odds birinin diğerine göre çekici olma olasılığının %82 daha fazla olması demek, 0,58 ise tam tersine az olması. 58 sayısı 100’den %42 daha azdır, ama 100 sayısı 58’den %72 daha fazladır. Tamamen akıl karıştırıcı matematik.). P değeri arada bulduğum farka güvenmemem gerektiğini belirtirken, odds oranı ise bu farkın anlamlılığını düşünmemi sağlıyor.

Ekran Resmi 2015-05-19 01.06.16
Farkın anlamsızlığı farkın yokluğu anlamına gelmez

RAZ-R: Biggest Shave Çalışması: Çok merkezli, 10 yıllık çalışma. Artık gönül rahatlığıyla hepimiz tıraş makinası alabiliriz

hugh-jackman-ftr
Bu görüntünün altında bir volverine saklı

Yine tıraş makinası firmasının yaptığı bir hit çalışma sayesinde işler biraz daha karışıyor. Bu sefer o kadar azimliler ki birçok ülkede birçok asistanı çalışmaya alıyor ve dünya çapında birkaç yıl süren bir çalışma yapılmasına ön ayak oluyorlar. Sonuçta tam 226000 asistanlık dev bir çalışma elde ediliyor (ilk çalışmamızın tam 1000 katı). 33000/112000 (%29,4) – tıraş olanlar: 33000/114000 (%28,9). P değeri tam 0,006973! Aynı sayıda asistan kullandığımda arada fark olmamasına rağmen sadece %0,6 ihtimalle en az %0,5 fark varmış gibi sonuç alabileceğimiz görülüyor. Verilerimiz çok keskin, aradaki farkı çok büyük ihtimalle doğru olarak tespit etmiş durumdayız. Peki ama esas önemli soruyu atlamayalım. Fark ne kadar? Sinekkaydı tıraş olan asistanlar, sakalla gezenlerden çekici olma olasılığı açısından tam 1,02 kat daha şanslı ve bu üstünlük istatistiksel olarak da 20 farklı örneklemin 19’unda geçerli! Güven aralığı da oldukça dar, olsa olsa bu odds oranı 1,0069 kat ile 1,0441 arasında değişebilir. Peki bu ne demek? Son derece anlamlı bir şekilde %0,69 ile %4 arasında değişen miktarda çekici olma ihtimaliniz var demek. İlk çalışmada %6,5 farkı bile anlamlı bulmazken şimdi %0,69 kadar az bir farkı anlamlı bulup buna göre karar vermek demek. Haydi hep beraber tıraş makinası almaya… (mı acaba?)

Ekran Resmi 2015-05-19 01.15.56
Yeterince büyük örneklem büyüklüğü alındığında anlamsız çıkmayacak hiçbir fark yoktur

Düşman kardeşler: Fisher, Neyman ve Pearson

Yukarıda ironi ve abartı ile verdiğimiz 4 örnek sanırım bir noktaya açıklık getirmiştir. P değerinin baktığımız karşılaştırmanın anlamlı olup olmamasıyla ilgili bir söyleyeceği yoktur. P değeri bulduğunuz farkın rastlantısal olarak gerçekleşme olasılığını size belirtir. Teorik olarak belirlenen p=0.05 sınırı, fark olmamasına rağmen örneklemimizin fark varlığını göstermesini (örnekleme hatası) %5 ihtimali aşmadığı sürece makul karşıladığımız anlamına gelir. Tip I hata olarak da tanımlanır (her ne kadar tip I hata her zaman örnekleme hatasına eşit olmasa da şimdilik genel kanıyı kabul edelim).

Fisher da çekiciliğini sakalına borçlu olanlardandı
Fisher da çekiciliğini sakalına borçlu olanlardandı

Ronald Fisher 1920’ler p değerini ilk ortaya attığında bunun definitif bir test olarak algılanacağını hiç düşünmemişti. 20’lerin sonunda, Fisher’in en azılı rakipleri olan Polonyalı matematikçi Jerzy Neyman ve İngiliz istatistikçi Egon Pearson, veri analizi için güç (power), yanlış pozitif, yanlış negatif ve diğer konseptleri ortaya atıp özellikle p değerine karşı çıktılar. Neyman, Fisher’in bazı çalışmalarını metamatiksel açıdan “kötüden de beter” olarak tanımlarken, Fisher da Neyman’ın yaklaşımını “çocukça” ve “Batı’daki entellektüel özgürlük adına korkunç” olarak nitelendirdi. Bu kavga, istatistikçi olmayan klinisyenlerin her iki konsepti birbirine yaklaştırıp beraber kullanarak yazdıkları kitaplar ve uygulamalar sayesinde bir karışık sisteme dönüştü. Tamamen bir kabul olarak başlayan sıfır hipotezinin %5 ihtimalle rastlantısal olarak elenmesi ihtimali birden farkın anlamlılığı kavramına dönüşerek en azından istatistikçi olmayan klinisyenler için anlaşılması ve içinden çıkılması imkansız bir hale geldi.

Pearson_Egon_4
Egon Pearson: Fisher’in top sakalına uyuz olduğundan p değerine ısınamadığı söylenir

P değeri, gözlenen sonucun ne düzeyde rastlantısal şansa bağlanabileceğini gösteren ihtimal olarak tanımlanıp, aradaki farkın anlamlılığına doğru evrilince bu hatayı daha net belirtmek için “Muhtemel Sebep” kavramı (probable cause) ortaya çıktı. Çünkü, P değeri araştırmacının esas aklındaki sorunun yanıtını vermekten çok uzaktı. O soru ise hipotezimin doğru olma ihtimali nedir sorusudur. Ancak bu noktada çok önemli bir basamak hep atlanır. O da hipotezin daha çalışma yapılmadan önce ne derece ihtimal dahilinde olduğudur. Örneğin, %5 ihtimalle doğru olabilecek ekstrem bir hipotezi test eden bir çalışma yapıyorsanız, p değeriniz 0,05 düzeyinde “istatistiksel olarak anlamlı” fark gösterse bile hipotezinizin gerçek hayatta doğru olması ve farkın gerçek olma olasılığı sadece %11’dir. Bu muhtemel sebep kavramına ilerdeki yazılarda tekrar değineceğiz.

Ekran Resmi 2015-05-19 01.57.16
Elde ettiğiniz sonuç ancak sorduğunuz soru kadar anlamlıdır

Sonuç

Sonuç olarak, p değeri hepimizin içine işlemiş olan “anlam” kelimesinin karşılığı kesinlikle değildir. Amacı, hedefi farklı olan bir konsept olarak son derece yanlış ifadelerle kullanmaya devam etmekteyiz. Bir faydanın ya da bir farkın ne kadar olduğu sorusuna yanıt vermez, sadece şansa bağlı olarak o sonuçla karşılaşma ihtimalimizin bir göstergesidir. P değeri yerine %95 güven aralıklarını, Odds ve Likelihood Ratio’ları kullanacağınız günler umarım ki bu yazıdan sonra daha yakın olsun.

Referanslar

  • Doll, H. (2005). Statistical approaches to uncertainty: p values and confidence intervals unpacked. Evidence-Based Medicine, 10(5), pp.133-134.
  • Sedgwick, P. (2012). What is a P value?. BMJ, 345(nov21 1), pp.e7767-e7767.
  • Sedgwick, P. (2010). P values. BMJ, 340(apr28 1), pp.c2203-c2203.
  • Nuzzo, R. (2014). Scientific method: Statistical errors. Nature, 506(7487), pp.150-152.
5 Şubat 2020 0 comments
0 FacebookTwitterPinterestEmail
İstatistik yazılarıTATDakademik

Odds Oranı, Rölatif Risk, NNT ve NNH

by Haldun Akoğlu 5 Şubat 2020
written by Haldun Akoğlu

Randomize kontrollü bir çalışmada genellikle “evet-hayır” şeklinde dikotom (iki seçenekli) sonlanım ölçütleri değerlendirilir (öldü-yaşıyor, hasta-değil, tanı var-yok). Makalede bu hedef sonlanımın geliştiği ve gelişmediği hastaların hem tedavi hem de kontrol gruplarındaki oranları karşılaştırılır. Bu tip bir sonlanımı bildirmenin olmazsa olmaz şekli 2 x 2 Tablo kullanmaktır.

Örneğin, tedavi grubunda hastaların %15’inin, kontrol grubunda ise %20’sinin kötü bir sonlanıma ulaştığı (mesela öldüğü ya da majör bir olayla karşılaştığı) Tablo 1’de 2×2 tablosu verilen bir çalışmayı ele alalım:

Tablo 1. Farazi bir randomize kontrollü çalışmanın hedef sonlanımdaki hasta sayıları
Tablo 1. Farazi bir randomize kontrollü çalışmanın hedef sonlanımdaki hasta sayıları

Bu noktada bazı temel terimlerin tanımlamasını yapmamız ve bazı temel hesaplamalar için gerekli formülleri vermemiz gerekli: (Kanıta Dayalı Tıp dili İngilizce olduğundan ve dilimizde bu terimlerin oturmuş bir karşılığı bulunmadığından terimlerin kendimize göre Türkçesinin yanı sıra İngilizce karşılıkları da parantez içinde verilmiştir.) Bu tanımlamaları yaparken Tablo 2’deki kutuların isimlendirmelerinden faydalanacağız.

Tablo 2. Farazi çalışma sonuçlarının formüllerle yeniden düzenlenmiş hali
Tablo 2. Farazi çalışma sonuçlarının formüllerle yeniden düzenlenmiş hali

Tedavi verilen ya da Deneysel grubun tedavi etkisini araştırdığımız sonlanıma (olay, yani burada ölüm) ulaşma oranına deneysel grup riski [Experimental Group Risk = EGR], ya da deneysel olay hızı [Experimental Event Rate = EER] adı verilir.

Kontrol grubunda aynı oran ise kontrol grup riski [Control Group Risk = CGR], ya da kontrol olay hızı [Control Event Rate = CER] olarak adlandırılır ve Formül 1 ve 2’deki şekilde hesaplanırlar.

EER_CER_formul

Bu iki oran arasındaki fark, verdiğimiz deneysel tedavinin kontrol grubundaki ölüm oranını ne kadar azalttığıdır. Örnek üzerinden gidersek, EER %15 (tedavi grubunda 100 hastada 15’i ölmüş) CER %20 (kontrol grubunda da 100 hastadan 20’si ölmüş) iken tedavinin %20 olan ölüm oranını %5 azaltarak %15’e indirdiğini söyleyebiliriz.

İki oran arasındaki net farka net risk azalması [Absolute Risk Reduction = ARR]) adı verilir (Formül 3).

ARR

Tedavinin etkinliğini bildirirken kullandığımız bir diğer terim Rölatif Risk ya da Risk Oranı’dır. Deneysel tedavi verilen hastaların ölüm riskinin (EER) kontrol grubundaki hastaların ölüm riskine (CER) oranı olarak ifade edilir. Örneğimize göre,

RR

Yani tedavi grubundaki hastalarda görülen ölüm riski (oranı) kontrol grubunun %75’i kadardır.

RR2

Bu tip dikotom sonuçlar bildirilirken en çok kullanılan yol ise rölatif riskin bir başka şekilde ifadesi olan Rölatif Risk Azalması değerinin belirtilmesidir (Relative Risk Reduction = RRR)(Formül 5). Kontrol grubunda olsaydı ölecek olan hastaların %25’i tedavi alırsa ölmeyecektir.

RRR

Eğer araştırmacılar Rölatif Riski (RR) belirli bir zaman dilimi için hesaplarlarsa buna da Hazard Oranı (Riziko Oranı) adı verilir.

Çalışmada belirtilmese bile çoğu zaman “X ilacı ölüm riskini azaltmada %30 başarılıydı” ya da “Y tedavisinin etkinliği %80 idi” gibi bir önermeyle aslında Rölatif Risk Azalmasından (RRR) bahsedilir. Eğer deneysel tedavi fayda sağlıyorsa RRR isim değiştirerek rölatif fayda artışı (Relative Benefit Increase = RBI), eğer kontrol grubunda görülen zararı arttırıyorsa rölatif zarar artışı (Relative Risk Increase = RRI) olarak ifade edilir.

Rölatif Risk Azalması (RRR) kullanmanın en önemli dezavantajı tedavi verilmeyen (kontrol grubundaki) hastaların olay riski (CER) hakkında hiçbir bilgi vermemesidir. Bu sebeple de çok küçük riskler olsa bile aralarındaki oransal farkı ifade etmesi yüzünden etki çok büyük gibi görünebilir. Örneğin, %0,000012 olan ölüm riski tedavi ile %0,000009’a düşüyorsa aslında tedavinin sağladığı net risk azalması sadece %0,000003 iken rölatif risk azalması %25’dir. Bu gibi durumlarda net risk azalmasının (ARR) ifade edilmesi çok daha doğrudur. Bu tip önermeleri farmasötik şirketlerinin hekimlere tanıtımda kullandığı materyallerde sıklıkla görebilirsiniz.

Bu ifadelerin elle tutulur bir gerçeğe dönüştürülmesi ihtiyacıyla tedavi edilmesi gereken sayı (Number Needed to Treat (NNT)) terimi tanımlanmıştır (Formül 6). Net risk azalmasının tersi olan bu tam sayı gündelik pratikte algılanabilir bir ölçektir. Çalışmadan belirtilen tedavi süresi boyunca gelişebilecek kötü sonlanım sayısını (olay, ölüm vb.) 1 tane azaltabilmek için kaç hastaya deneysel tedavinin uygulanması gerektiğini gösterir. Bir önceki paragrafta yer alan örnekten devam edersek ARR %0,000003 olduğuna göre

NNT1

olarak hesaplanabilir. Bu sayı, tedavi verilmediği takdirde ölecek olan 1 hastanın yaşayabilmesi için 33 milyon hastaya tedavi verilmelidir anlamına gelir! 1 hastada tedavi faydası görebilmek için milyonda 1 görülecek bir yan etkiden 33 kişinin zarar görecek olmasının mantıklı olmadığını rahatlıkla söyleyebiliriz. Halbuki, RRR (rölatif risk azalması) %25 gibi gayet anlamlı bir tedaviden bahsetmekteydik. Genel olarak, NNT ne kadar küçükse tedavinin etkisi o kadar güçlü, ne kadar yüksekse o kadar düşüktür.

NNT2

Yan etki için de aynı mantıkla advers bir olay görülmesi için tedavi edilmesi gereken hasta sayısı (Number Needed to Harm (NNH)) hesaplanabilir. Bu hesaplamada net risk artışı (ARI) kullanılır. Beş yıl boyunca tedavi etkisinin izlendiği bir statin çalışmasında kontrol grubunda %0,03 rabdomiyoliz görülürken bu oran tedavi grubunda %0,05 olarak gözlenmiş olsun.

ARI

Tedavi verilen hastalarda kontrol grubuna göre fazladan 1 kişide daha rabdomiyoliz görülmesi için 5000 hastaya 5 yıl boyunca statin verilmesi gereklidir.

Çalışmaların bazılarında yazarlar riskleri vermeyi tercih ederken diğerlerinde Odds Oranının (OR = OO) kullanıldığını göreceksiniz. Bu tercih kişisel bir tercih olup aslında aynı şeyleri ifade eden sayıların farklı gösterim şekillerinden ibarettir. Odds terimi özellikle ülkemizde herkesin kafasını karıştıran bir terim. Aslında bu terim İngiliz kumar ve bahis jargonundan gelir ve olasılık istatistiklerine de aynı kelimeyle geçmiştir.

Rulet oyunu üzerinden örnek verirsek, kırmızı ya da siyah gibi 2’li bahislerden birine oynayıp kazandığınız takdirde yatırdığınız her 1 birim karşılığında 1 birim daha kazanırsınız. İlk başta koyduğunuz kendi bahsinizi kaybetmediğiniz için paranız 2 katına çıkar. Bu bahsin oddsu 1’e 1, 1:1 ya da 1’dir. “Kaybedersen 1 birim kaybedersin ama kazanırsan 1 birim daha kazanırsın”, ya da her “1 birim kazancın için ben 1 birim kaybederim” şeklinde de ifade edilebilir. Rulette herhangi bir sayıya oynadığınız takdirde risk ettiğiniz ve kaybedebileceğiniz her 1 birim için 35 birim kazanırsınız, yani 1’e 35 kazanırsınız, ya da odds 1:35 veya 35’dir. Kazandığınız takdirde elinizdeki para yatırdığınız da dahil olmak üzere ilk bahsinizin 36 katıdır.

Bir başka örnek ile tekrarlayalım: 6 yüzlü bir zar attığınızda, tuttuğunuz sayının gelme olasılığı (ihtimali) 6’da 1 yani 1/6, gelmeme ihtimali de 6’da 5 yani 5/6’dır. Tuttuğunuz sayının gelme olasılığının (ihtimalinin), gelmeme olasılığına oranı olan 1:5 olup odds 1:5 ya da 5’dir. Bunu, “tuttuğunuz zarın gelme ihtimali 1’e 5’tir” olarak da söyleyebiliriz (6’da 1 ve 1’e 5 aynı şansın farklı sayısal gösterimleri: ilki olasılık, ikincisi odds).

Peki, zar atımında tek sayı gelme oddsu nedir? 6 sayıdan 3’ü tek 3’ü çift olduğuna göre 3:3 ya da 3’e 3’tür. Bu da 1 oddsa karşılık gelir (3:3 = 1:1). Yani, tuttuğunuz sayının (bu örnekte tek sayılar) gelme olasılığı, gelmeme olasılığına (çift sayılar) denk olduğundan odds 1’dir. Bu söylem istatistik bilimine geçerken biraz erozyona uğrar ve kaybedeceğin:kazanacağın oranı olan odds, olma olasılığı/olmama olasılığı, ölüm/sağkalım, sağlıklı/hasta haline dönüşür.

Dört gözlü tablodaki örneğimize dönelim: Tedavi grubunda 15 kişi ölürken 85 kişi yaşamıştır (Formül 7). Yani tedavi grubunda ölüm oddsu 15:85 ya da 3:17’dir. Ölen her 3 kişiye karşılık 17 kişi yaşamış, 20 kişiden 3’ü ölmüş veya 20 kişiden 17’si yaşamıştır. Kontrol grubunda ölüm oddsu 20:80 veya 1:4’tür (Formül 8). Ölen her 1 kişiye karşılık 4 kişi yaşamış, 5 kişiden 1’ü ölmüş veya 5 kişiden 4’ü yaşamıştır. Tedavi ve kontrol gruplarının oddsları arasındaki orana ise Odds Oranı ya da tam ifadesi olmamakla beraber Olasılıklar Oranlarının Oranı (Odds Oranı, OO) adı verilir (aslında olasılıklar oranı sizin de gördüğünüz gibi oddsun kendisi. Dolayısıyla odds oranına da olasılıklar oranlarının oranı dememiz lazım. İşte odds oranında kafa karışıklığının sebebi buradan geliyor). Tedavi grubunun ölüm oddsunun kontrol grubun ölüm oddsuna oranı olan odds oranı,

OO

olarak hesaplanabilir (Formül 9). Eğer odds oranı 1 ise tedavinin kontrol grubuna göre farklı bir olasılığa sahip olmadığını söyleyebiliriz. Eğer odds oranı 1’in üstündeyse odds oranına bakılan olay ya da sonlanım tedavi ile artmakta, altındaysa azalmaktadır.

Odds

Hangi Odds’un hangi Riske karşılık geldiği Tablo 3’de gösterilmiştir. Odds ve Riskin birbirine dönüşüm formülleri Formül 10 ve 11’de verilmiştir.

Odds’lar görüldüğü gibi daima risklerden sayısal olarak daha yüksektir. Risk çok yüksekse odds ve risk arasındaki fark daha da büyür, risk çok düşükse arada neredeyse hiç fark kalmaz. Klinisyenler olarak anlaması ve algılaması çok daha kolay olan RR’nin OR’yle ilişkisini bilmek ve her ikisini birbirine dönüştürebilmek durumundayız. Şansımıza, tıbbi uygulamalarda hastalarımızın karşı karşıya kaldığı riskler genellikle düşük olduğundan RR ve OR birbirine yakındır. OR kullanıldığında tedavinin sanki daha etkinmiş gibi bir algılaması oluşur.

Örneğin, bir ilacın etkinliği (istenen sonuç) tedavi grubunda %45 kontrol grubunda %30 ise, tedavi grubunun oddsu 0,82 (0,45 / 0,55) iken kontrol grubunun oddsu 0,43 (0,30 / 0,70) olup, RR 1,5 (0,45 / 0,30) OR 1,91’dir (0,82 / 0,43).

Risk_Odds
Tablo 3. Risk ve Oddsların birbiriyle karşılaştırılması
Risk

Peki, madem OO işleri bu derecede karıştırıyor ve anlaması da zor, neden kullanmaya devam ediyoruz? OO yukarıda bahsettiğimiz örneklerdeki randomize kontrollü çalışmalardan ziyade gözlemsel kohort çalışmalarda daha faydalıdır. Kohort çalışamalarda, araştırmacılar belirli risklere sahip hastaları belirli bir zaman izler ve oluşan istenmeyen olayların frekanslarının kaydını tutar. Vaka-kontrol çalışmalarında ise katılımcılar halihazırda zaten istenmeyen sonuca ulaşmıştır. Araştırmacılar bu sonlanıma ulaşmış hastalara denk bir kontrol grubu seçer (bu kontrol grubunda kaç kişi olacağına ve vakalarla oranına çalışmacılar karar verir) ve geriye dönük olarak her iki grubun geçmişinde risk varlığının oranını karşılaştırır. Bu tip çalışmalar hastalıkların prevalansı hakkında bilgi vermez, çünkü hasta ve kontrol sayısı hastalığın toplumdaki prevalansına denk şekilde değildir, araştırmacıların tercihleriyle oluşturulmuştur.

Örneğin, KOAH gelişiminde en az 1 yıl soba bulunan bir evde yaşamanın etkisi bir vaka-kontrol çalışmasıyla incelenmek istense, KOAH hastası olan bir grup ile kendi seçeceğimiz bu gruba denk bir kontrol grubunun özgeçmişlerindeki sobalı evde yaşama durumlarının frekanslarını karşılaştırmamız gerekir. 277 KOAH hastamız olduğunu ve bunların 67’sinde soba dumanı maruziyeti olduğunu varsayalım. Kontrol grubu olarak da KOAH dışındaki değişkenler açısından bu gruba denk, polikliniğimize başvuran 283 hasta seçmiş olalım ve bunların da 41’inde soba maruziyeti belirlemiş olalım. Bu durumda örneğimizin dört gözlü tablo yapısı Tablo 4’deki gibi olacaktır.

Tablo 4. Farazi Vaka-Kontrol Çalışmamızın Dört Gözlü Tablosu
Tablo 4. Farazi Vaka-Kontrol Çalışmamızın Dört Gözlü Tablosu

Bu tablodan yola çıkarak;

Ornek1

risk nispeten orta seviyede olduğundan RR ile OO arasında fark olduğunu, OO’nun daha yüksek olduğunu görürüz. Araştırmacılar tam 2 katı büyüklükte bir kontrol grubu seçseydi sonuçlarımız değişir miydi? (Tablo 5)

Tablo 5. Farazi Vaka-Kontrol Çalışmamızın Dört Gözlü Tablosu, kontrol grubu iki katı olsaydı
Tablo 5. Farazi Vaka-Kontrol Çalışmamızın Dört Gözlü Tablosu, kontrol grubu iki katı olsaydı

Bu durumda,

Ornek2

Görüldüğü gibi, vaka-kontrol çalışmalarında rölatif risk tamamen kontrol grubundaki hasta sayısına bağlı iken, odds oranı kontrol grubunun hasta sayısı ile değişmemekte.

Bu sebeple, odds oranı vaka-kontrol çalışmalarında kullanılması ve raporlanması gereken ölçüttür.

OR’nin diğer önemli özellikleri ise şunlardır:

  1. Meta-analizlerde birbirinden çok farklı olay oranları bir araya getirilmeye çalışıldığından aynı mantıkla RR yerine OO kullanılması gerekir.
  2. OO, maruziyete bağlı birbirini tamamlayan sonlanımınların yönüne göre birbirinin tersi değerler alır. Mortalite için bakılan OO 4 ise, sağkalım için aynı çalışmada OO ¼’tür.
  3. Risk ne kadar büyürse büyüsün RR tam anlamıyla yükselmez. Halbuki OO temel risk oranının büyüklüğünden etkilenmez. OO, 0 ile sonsuz arasında değerler alabilirken, RR alamaz.
  4. OO, maruziyet ile sonlanım arasındaki ilişki ve etkinin büyüklüğünün ölçüsü olduğundan lojistik regresyon için kullanılan parametredir. Tarihsel açıdan OO her türlü ilişki bildirimi için tercih edilen ve daha doğru kabul edilen ölçüt olsa da modern istatistiksel yöntemler kullanıldıkça önemliliği azalmaktadır.
5 Şubat 2020 0 comments
0 FacebookTwitterPinterestEmail
İstatistik yazılarıTATDakademik

İstatistik ve Analiz Yazılımları: SPSS ve MedCalc ile veri girişi nasıl yapılır?

by Haldun Akoğlu 5 Şubat 2020
written by Haldun Akoğlu

İstatistiksel analiz için test seçimlerine ait bir algoritmayı bir önceki yazımda paylaşmıştım. Şimdi yavaş yavaş kullanacağımız istatistik yazılımlarına ardından da bu testlerin yapılışlarına gireceğiz. Kullanacağımız 3 farklı istatistik yazılımı var: IBM SPSS 20, MedCalc 16.1.2 ve GPower. Bunlar dışında internetten de bazı çevrimiçi istatistik ve analiz sitelerinden yararlanacağız. Hem IBM SPSS hem de MedCalc ücretli yazılımlar. MedCalc nispeten daha uygun (445 $), hekimlerin daha anlayacağı bir formatta ve deneme sürümü ile yaptığınız analizleri yayınlarınızda kullanma hakkı veriyor. SPSS için çoğu üniversitenin abonelikleri mevcut, bunlar aracılığıyla çok uygun fiyata öğrenci ve akademik hesaplar satın alınması mümkün. Ancak böyle bir seçenek yoksa deneme sürümlerini de kullanabilirsiniz. Öncelikle biraz programlardan ve özelliklerinden bahsedelim:

Uyumluluk ve İşletim Sistemleri

SPSS 19. Sürümden itibaren IBM tarafından alınan bir yazılım. SPSS inc. ise öncesinde yaptığı bir değişiklikle veri ve döküm dosyaları değiştirmişti. Bu nedenle versiyon 16 ve sonrası ile 15 ve öncesi 2 ayrı program gibi birbirinin veri ve döküm dosyalarını açmakta ve okumakta zorlanıyor. Bu sıkıntıları nasıl aşacağınızı Dosya formatları kısmında daha geniş olarak belirttim. IBM SPSS satın aldıktan sonra Mac, Linux ve Windows’daki sürümlerini kullanabilirsiniz. Ancak MedCalc için sadece Windows sürümü var. Eğer Mac bilgisayarınızda MedCalc kullanmak istiyorsanız Parallels gibi bir program ya da BootCamp ile bilgisayarınıza Windows da kurmalısınız.

Dosya formatları

SPSS veri dosyalarını .sav olarak döküm dosyalarını .spv olarak saklıyor. Bu iki dosya da SPSS’e özel. SPSS olmadan döküm dosyalarını (.spv) okuyabilmek için SPSS Smartreader IBM sitesinden indirilip kullanılabilir (http://www.ibm.com/developerworks/spssdevcentral). SPSS Smartreader SPSS 16 ve üstündeki sürümlerle hazırlanmış materyalleri açıp okumanıza ve sınırlı şekilde düzenlemenize (pivot tablo düzenleme, tablo renk, font düzenleme vb gibi) izin veriyor. SPSS 16’dan daha önceki sürümler için ise döküm dosyasının uzantısı farklı ve .spo şeklinde. Bu dosyaları görüntülemek için SPSS Legacy Viewer adlı IBM öncesi döneme ait görüntüleyiciyi kullanmanız gerekli. IBM telif hakları sebebiyle bu programı sitesinde barındırmıyor ancak ftp üzerinden (ftp://ftp.software.ibm.com/software/analytics/spss/support/Stats/Docs/Statistics/LegacyViewer/readme.html) indirmeniz mümkün. SPSS SAS, STATA, SYSTAT programlarına ait veri dosyaları ile MS Excel .xls dosyalarını açabiliyor ama OpenOffice ve MedCalc dosyaları ile uyumsuz.

MedCalc veri ve döküm dosyalarını bir arada tutan kendine has .mc1 dosya formatını kullanıyor. Bu dosyaların SPSS ile görüntülenmesi mümkün değil. MedCalc .mc1 dışında Excel, OpenOffice ve SPSS sav formatlarında da veri dosyalarını kaydedebilmekte. Ancak veri dışında dökümlerin de kaydedilmesi için .mc1 dosyası oluşturmanız gerekiyor. MedCalc programınız olmasa bile Free MedCalc Viewer ile (https://www.medcalc.org/download.php) .mc1 dosyalarını görüntüleyebilirsiniz. MedCalc v16 ile beraber istenen her dökümün ardı ardına bir MS Word dosyasına aktarılması fonksiyonu gelmiş durumda. Aşağıdaki MedCalc ekranında en sağdaki kırmızı ile işaretli W butonuna her bastığınızda aktif ekrandaki dökümleri sırasıyla aynı ya da farklı MS Word dosyasına atma imkanı verilmiş. Grafikleri de ayrı ayrı kaydetme imkanınız olduğundan sadece veri için SPSS .sav formatını kullanarak hiçbir kayıp yaşamadan SPSS ortak dosyaları kullanmanız mümkün. MedCalc SPSS, SAS, STATA, MS Excel ve OpenOffice dosyalarını açabiliyor. Her iki programın rahat çalışması için SPSS’in veri dosyası formatı olan .sav kullanmak en mantıklısı.

Screen Shot 2016-01-31 at 21.08.41

[box type=”info” align=”aligncenter” class=”” width=””]Dipnot: Excel dosyaları için SPSS ve MedCalc da MS Excel’in yeni formatı olan .xlsx açmakta zorlanıyor ve hatalar yapıyor. Excel’den veri geçirilecekse .xls olarak önce kaydedip sonra bu programlarda açmak en mantıklısı. Eğer bir .xls dosyasını SPSS ile açmakta zorlanırsanız (ki sıklıkla başınıza gelmesi muhtemel) Medcalc ile açıp verinin sorunsuz şekilde geçtiğinden emin olduktan sonra (virgüller, ondalık sayılar) SPSS .sav dosyası olarak kaydedip SPSS’de rahatlıkla açabilirsiniz. Özellikle Mac kullanıcıları bu problemi daha sık yaşayacaklardır. [/box]

Atıf verme

SPSS

SPSS 19. Sürümden itibaren IBM firması tarafından alındığından istatistik paketine atıf verilirken aşağıdaki bilgiler kullanılmalıdır.

  • SPSS for Windows, Version 16.0. (SPSS Inc. Chicago, USA. Released 2007)
  • SPSS for Windows, Version 17.0. (SPSS Inc. Chicago, USA, Released 2008)
  • PASW Statistics for Windows, Version 18.0. (SPSS Inc. Chicago, USA, Released 2009)
  • IBM SPSS Statistics for Windows, Version 19.0. (IBM Corp. Armonk, NY: USA. Released 2010)
  • IBM SPSS Statistics for Windows, Version 20.0. (IBM Corp. Armonk, NY: USA. Released 2011)
  • IBM SPSS Statistics for Windows, Version 21.0. (IBM Corp. Armonk, NY: USA. Released 2012)
  • IBM SPSS Statistics for Windows, Version 22.0. (IBM Corp. Armonk, NY: USA. Released 2013)
  • IBM SPSS Statistics for Windows, Version 23.0. (IBM Corp. Armonk, NY: USA. Released 2014)
MedCalc

MedCalc sürümlerinde Help > How to cite Medcalc altında aşağıdaki gibi bir atıf metni yer almaktadır.

  • MedCalc Statistical Software version 16.1 (MedCalc Software bvba, Ostend, Belgium; https://www.medcalc.org; 2016)

Yeni veri dosyası yaratmak

Her çalışmanın planlama aşamasında hangi verilerin toplanacağına, bu verilerin nasıl kaydedileceğine ve nasıl bir analiz yapılacağına karar verilmiş olmalıdır. Çalışmanızın amacı ve dizaynı birincil ve ikincil sonlanım ölçütlerinizin neler olduğunu belirler. Dolayısıyla, hangi değişkenleri toplayıp nasıl bir analiz ile anlamlılıkları değerlendireceğiniz baştan bellidir. Bunun ardından veri toplama için kullanacağınız anket, tablo ya da form gibi bir materyal hazırlanır ve etik kurul onayı alınır. İşte bu form, anket ya da tablo verilerini önceden istatistik yazılımlarında nasıl kodlayacağınızı belirler ve veri dosyasını hazırlarsanız sonradan yanlış ya da eksik kodlanmış bir veriyi tekrar dönüştürmek zorunda kalmazsınız. Ayrıca başlangıçta MS Excel gibi bir yazılıma girilen verilerin düzgün şekilde istatistik yazılımlarına aktarılamayabileceğini yukarıda belirtmiştik. Şimdi sıfırdan bir veri dosyası oluşturalım:

SPSS

SPSS açıldığı anda aşağıdaki ekranla başlar. Burada yeni veri dosyasını sağda yer alan Type in data seçeneğini seçerek oluşturuyoruz.

Screen Shot 2016-01-31 at 16.41.20

Alternatif olarak bu ekranı Cancel ile geçip File > New > Data seçeneğiyle boş veri dosyasını oluşturabiliriz.

Screen Shot 2016-01-31 at 20.25.10

Yeni bir dosya oluşturulduğunda aşağıdaki gibi bir ekranla karşılaşacaksınız.

Screen Shot 2016-01-31 at 20.26.08

Başlık kısmında yazan Untitled (DataSet) kısmı dosyayı henüz herhangi bir isimle kaydetmediğimizi gösteriyor. Veri dosyasında ilk düzenlemeyi yaptığımız andan itibaren bu dosyayı kaydetme imkanımız olacak. SPSS bizi 3 farklı ekranda çalıştırıyor olacak: İlk ekranımız olan Data View (bu ekran) MS Excel ekranına çok benziyor. Her satır bir vakayı, her sütun da bir değişkeni (yaş, cinsiyet vb) göstermekte. En altta Data View ve Variable View seçeneklerini görüyoruz. Variable View tuşuna basarak değişken bilgilerinin olduğu ikinci ekranımıza geçiyoruz:

Screen Shot 2016-01-31 at 20.31.50

Bu ekranın farkı her satırın bir değişken her sütunun da değişken ile ilgili bir özellik olması. Burada her satıra yazdığımız değişkenler Data View ekranında sütunlar haline gelecek. Önce bu ekranı doldurmalıyız.

Screen Shot 2016-01-31 at 20.33.45

Name sütununa yazdığımız isimler bilgisayarın kendi sistemi için kullanacağı değişken isimleri olacak. Örnek olarak yukarıda No, Yaş ve Cinsiyet yazdık. Yanlarındaki tüm veriler otomatik olarak dolduruldu. Verinin tipine göre bunları düzeltmemiz gerekli. 2. Sütundaki Type seçeneğini ise veri olarak gireceğimiz değerlerin tipini belirlemek için kullanacağız.

Screen Shot 2016-01-31 at 20.35.40

2. sütunda numerik yazan yere tıkladığımızda Type için seçeneklerimizin yer aldığı menü çıkacak. Burada en sık kullanacağınız seçenekler Numeric ve String. Numeric yani sayısal olarak girmediğiniz hiçbir değeri istatistiksel hesaplama için kullanamazsınız. Yani, kadın cinsiyet için K, erkek için E yazarsanız bunlar program tarafından String, yani metin olarak kabul edilir ve üzerinde hiçbir işlem yapılamaz. Özellikle Excel’den veri çekerken eğer kodlama sayısal olarak yapılmadıysa önce tüm metinlerin sayılara dönüştürülmesi gerekir. Bunun olmaması için bu dosyanın başta doğru hazırlanması çok önemli.

Bu ekranda sağda yer alan Width en fazla kaç haneli bir değere izin vermek istediğinizi gösteriyor. Eğer ben 1’den 99’a kadar olan değerleri kabul etmek istiyorsam burada 2 yazmalıyım. Altındaki Decimal Places ile ise her numerik sayı için otomatik olarak kaç ondalık hane gösterilmesini istediğimizi seçiyoruz. Mesela, cinsiyet değişkeninde erkek için 1 kadın için 0 kullanacaksam 1 ve 0 değerlerinin ondalık basamağa gereksinimi olmadığından buraya 0 yazıyorum. Yaş için de aynısı geçerli. Ama CRP değişkenim olsaydı ondalık 2 hane kullanmak isteyeceğimden aynı şekilde bırakacaktım. Bu ayarlamayı her değişken için yapıyoruz. Farkettiğiniz gibi bu seçenek için bu menüyü açmamıza gerek yok. Type seçeneğinin hemen yanındaki sütunlardan da bu ayarlamayı yapabiliriz.

Label sütünü her değişkenin tablo ve analiz ekranlarında hangi isimle ifade edilmesini istediğimizi gösteriyor. Değişken ismi olarak SPSS her metni kabul etmez. Değişken isimleri sayıyla başlayamaz, aralarında boşluk olamaz, ayrıca çoğu ekranda görünmeyeceklerinden dolayı en fazla 10-15 karakter uzunluğunda olmalarını isteriz. Ancak bu isimler tablo ve grafiklerde güzel görünmez. Bu yüzden buraya görünmesini istediğimiz değişkenin Etiketini yazıyoruz.

Screen Shot 2016-01-31 at 20.33.45

Sonradan kolaylık olması açısından bu aşamada dosyamızı hemen kaydedelim. Bunun için üstteki büyük tuşlardan 2.si olan ve diskete benzeyen kırmızı ile işaretli kayıt tuşuna basmamız yeterli. Aşağıdaki şekilde olduğu gibi açılan menüden kayıt işlemimizi gerçekleştiriyoruz.

Screen Shot 2016-01-31 at 20.49.26

Kayıt işlemi gerçekleştiği andan itibaren üst satırda artık ismin solunda SPSS .sav dosyasının ikonu görünmeye başlayacak.

Screen Shot 2016-01-31 at 20.51.37

Bir sonraki basamakta hangi değişkenler kategorik hangileri sürekli onu seçmemiz gerekiyor. Kategorik değişkenler için de her kategorinin hangi sayıyla temsil edildiğini ve kategorilerin adlarını gireceğiz. Bu aşama en önemli kısım. Hatta diğerlerini yapmasanız sadece bunları yapsanız bile olur. Çünkü bir çalışmanın planlama, veri giriş, analiz ve yazım aşamaları genellikle yıllar mertebesinde süren bir iş. Bu zaman diliminde cinsiyet için kadını hangi sayıyla kodladığınızı belki hatırlamanız olası ama daha karmaşık değişkenleri büyük ihtimalle unutacaksınız. Her değişken için Values sütununa bastığınızda karşınıza alttaki menü çıkacak:

Screen Shot 2016-01-31 at 20.57.42

Bu menüde Value o kategori için seçtiğiniz kod sayısı, Label ise kategorinin ismi. Örneğin cinsiyet değişkeni için bu menüyü açalım. Kadın 0 Erkek 1 olarak kodlama yaptıysak aşağıdaki gibi Value kısmına 0 Label kısmına Kadın yazıp Add tuşuna basıyoruz:

Screen Shot 2016-01-31 at 20.59.16

Ardından Erkek için aynı işlemi tekrarlıyoruz:

Screen Shot 2016-01-31 at 21.00.22

Son olarak OK tuşuna basarak bu işlemi tamamlıyoruz.

Measure kısmında değişkenlerin tiplerini seçiyoruz. Kabaca 2 ana değişken tipi olan Nominal ya da Scale seçeneklerinden biri bizim için yeterli. Kategorik değişkenler için Nominal, sürekli değişkenler için Scale seçmeliyiz. Böylece yanlışlıkla olmayacak bir veri çeşidi ile analiz yapmak istediğimizde SPSS bize izin vermeyecek. Ayrıca grafikleri hazırlarken de değişkenin çeşidine uygun grafik seçeneklerini bize sunacak.

Screen Shot 2016-01-31 at 21.02.51

Bu şekilde veri setimizin değişkenlerini tamamladık. Tekrar Data View tuşuna basarak veri giriş ekranına dönelim.

Screen Shot 2016-01-31 at 21.04.21

Panelde kırmızı ile işaretli Value Labels butonuna bastığınızda verileriniz tanımladığınız kategori isimleriyle beraber verilecek, böylece veri girişi yaparken seçenekler arasından seçme şansınız da var. Hem de unutma imkanınız artık kalmamış oluyor.

Screen Shot 2016-01-31 at 21.07.05

En son dosyanızı tekrar kaydetmeyi unutmayın.

MedCalc

MedCalc SPSS’den farklı olarak ön bir seçim ekranı olmaksızın açılır açılmaz boş bir panele bizi yönlendiriyor. File > New seçeneği ile yeni veri dosyamızı oluşturuyoruz.

Screen Shot 2016-01-31 at 21.15.19

Hemen ardından File > Save As diyerek dosyamızı bir yere kaydedelim. Kayıt işlemi rutin Windows uygulamaları aracılığıyla yapılıyor.

Screen Shot 2016-01-31 at 21.18.39

Dosyamızı MedCalc’in kendi formatı olan .mc1, Excel formatı olan .xls (.xlsx seçmenizi kesinlikle tavsiye etmiyorum), SPSS .sav, OpenOffice .ods hatta Html (yani internet sitesi sayfası) dosyası olarak kaydedebiliriz. Kayıt işleminden sonra boş bir veri giriş ekranımız olacak.

Screen Shot 2016-01-31 at 21.15.53

Aynı şekilde her satır bir vaka her sütun da bir değişken. Ancak burada SPSS’deki gibi bir değişken ekranı yok. Bunun yerine değişkenleri gireceğimiz Variable List seçeneğimiz var. Ancak SPSS’den farklı olarak önce verilerin girildiği ekranda bazı düzenlemeler yapmamız lazım. Hatta tamamen girilmiş bir veriden de veri listesini çekmemiz mümkün.

Elimizle istediğimiz değişken isimlerini Veri satırlarının üzerinde kalan (1. Satırın da üstünde) satıra her değişken bir sütuna gelecek şekilde yazıyoruz:

Screen Shot 2016-01-31 at 21.29.34

Ardından Tools > Edit variables list diyerek değişken listemizin olduğu ekranı açıyoruz. Ya da daha kolay şekilde sol paneldeki Variables seçeneğine de tıklayabiliriz.

Screen Shot 2016-01-31 at 21.21.59

Bu ekranda az önce değişken isimlerini yazdığımız değişkenleri görebilirsiniz:

Screen Shot 2016-01-31 at 21.31.19

Herhangi birini seçip üzerinde ayarlamaları yapabiliriz. Bunun için değişkeni seçtikten sonra (mavi hale geldiğinde) aktifleşen Properties butonuna basmalıyız.

Screen Shot 2016-01-31 at 21.32.06
Screen Shot 2016-01-31 at 21.32.14

SPSS’den alışık olduğumuz şekilde Değişken İsmi (Variable), Değişkenin Etiketi (Label) ve kategori kodları ve isimlerini (Value Labels) giriyoruz. Burada önemli olan nokta SPSS ve MedCalc’ın değişken isimlerine aynı muameleyi yapmadığını bilmek. SPSS son derece katı kurallar uygularken MedCalc son derece esnek. Dolayısıyla her halükarda SPSS ile de çalışmak isteriz diyerek bu değişkenlerin öz isimlerini (variable) daha kısa ve uygun, etiketlerini ise (Label) bize bilgi verecek açıklayıcı ya da ekranda görmek istediğimiz şekilde yazmalıyız. Örnek değişken öz isimleri yas, cinsiyet, KAH_VY, HT_VY, yas_grup olabilir. Mümkün oldukça Türkçe karakter kullanmayın ve boşlukları alt çizgi (_) ile doldurun. SPSS boşlukları değişken isimlerinde kabul etmiyor. Türkçe karakter kodlaması için ise bazı ayarlar yapmanız gerekiyor. Etiketler için böyle sıkıntılar söz konusu değil.

Screen Shot 2016-01-31 at 21.24.53

Girişleri tamamladığımızda değişken listemiz aşağıdaki şekilde değişken ismi ve etiketi listesi şeklinde görünmeye başlayacak.

Screen Shot 2016-01-31 at 21.36.16

Dosyamızı ara ara kaydedip veri girişine başlayabiliriz.

Son

Her iki programla da bu şekilde ilk dosyanızı oluşturup verilerinizi girerseniz hem hazır bir dosya ile anında analiz yapma şansınız olur, hem de eğer istatistiksel analizleri bir başkası yapacaksa onları saatlerce kodları dizmek ve düzenlemek zahmetinden kurtarırsınız. İnanın sırf bu yüzden sonuçlarınızı çok daha hızlı elde edeceğinizden emin olun.

[box type=”info” align=”aligncenter” class=”” width=””]Unutmayın! Eğer bir değişkenin asıl değerini yazabilecekseniz asla gruplamayın. Gruplandırılmış bir değişkeniniz varsa asla alt kategorilerin isimlerini ya da sayıların yanına birimlerini yazmayın. İstatistik programlarının sadece sayılarla çalıştıklarını unutmayın.[/box]

5 Şubat 2020 0 comments
0 FacebookTwitterPinterestEmail
Araştırma planlama yazılarıİstatistik yazılarıTATDakademik

Test öncesi ve sonrası olasılıklar

by Haldun Akoğlu 5 Şubat 2020
written by Haldun Akoğlu

Tanıya yaklaşım çeşitleri

Genellikle hastalarımıza tanı koymaya çalışırken birbirini tamamlayan iki farklı yaklaşımı bir arada uygularız: [highlight color=”yellow”]İlki[/highlight] bir şablon ya da kalıbın tespit edildiği [highlight color=”blue”]“patern tanıma”[/highlight]yaklaşımıdır.[1-4] Erizipel ya da zona döküntüsünü görüp tanıma, fraktür, hareketsizlik ve nefes darlığı ile pulmoner emboli birlikteliği, batında şişlik, medusa başı, spider anjiyom mevcudiyetinde karaciğer sirozu tanısı gibi hekimlerin alışık olup sık gördükleri şablonlara uyan fizik muayene bulguları ile hikaye özelliklerinin birleştirilmesi yoluyla konulan tanıları belirler. [highlight color=”yellow”]İkinci tanısal yaklaşım[/highlight] ise basit bir şablonun konuyu açıklamakta yetersiz kaldığı ve hekimlerin daha analitik bir yolda ayırıcı tanıları irdeledikleri [highlight color=”blue”]“olasılık temelli tanısal muhakeme”[/highlight] diyebileceğimiz [highlight color=”blue”]“probabilistik yöntem”[/highlight]dir.[5-9] Bu yöntemde hikaye, fizik muayene ve bulgulara göre hekimler muhtemel birkaç tanı belirler, her birinin olasılığını değerlendirir, bu olasılıklara göre her bir tanıyı koyduracak ya dışlayacak testler isteyerek bazı tanıları dışlayıp bir tanesi üzerinde yoğunlaşmaya çalışırlar. İlk yöntem tıp mesleğinin incelikleri ve mesleki tecrübe ile yakından ilişkiliyken, ikinci yaklaşım hastalıkların anatomi ve patofizyolojisi ile klinik çalışmalardan elde edilen verilerin değerlendirilmesini ve uygulanan tanı testlerinin sınır ve yetkinliklerinin bilinmesini gerektirir.

Bu aşamada en uygun yaklaşım, belirli bir şablona uymayan belirti ve bulguları kümeler halinde sıralamak ve ayrı birer [highlight color=”blue”]“klinik problem”[/highlight] halinde sebep-sonuç ilişkilerini düşünmektir. Bu klinik problemler ayırıcı tanıyı yapmak üzere olasılıkların ayrı ayrı değerlendirileceği bir liste oluşturmaya yardımcı olur. Örneğin, batında şişlik, medusa başı ve spider anjiyom ile başvuran hastada klinik problem olarak [highlight color=”yellow”]“defans ve rebound vermeyen, akut batın hüviyetinde olmayan açıklığı yukarı batan matite ile giden karın şişliği”[/highlight] ayırıcı tanı açısından fikir verici bir sorun olarak listelenmelidir.

Klinik problemler listelendikten sonra bu klinik problemleri açıklayacak ayırıcı tanılar belirlenir ve bu tanıların her birine bir olasılık atfedilir. Bu kısım, gereksiz tetkik ve girişimleri azaltmak açısından çok önemlidir. Tüm ayırıcı tanılar için gerekli tüm testlerin aynı anda yapılması hem hastaya ihtiyaç olandan daha fazla sıkıntı yaşatır, hem maliyetlidir hem de gereksizdir. Bu sebeple ayırıcı tanılar kabaca 3 ana şekilde gruplandırılır:

[box type=”shadow” align=”aligncenter” class=”” width=””]

  • en muhtemel olandan başlayarak ihtimallerine göre (olasılık temelli ayırıcı tanılar),
  • tanı konamaz ya da tedavi edilemezse hayatı tehdit edici sonuçlarının ağırlığına göre (prognoz temelli ayırıcı tanılar), ve
  • tedavisi kolay, yan etkisiz ve çabuk olmasına göre (pragmatik liste).[10]

[/box]

[box type=”note” align=”aligncenter” class=”” width=””][highlight color=”yellow”]Bir örnek üzerinden gidelim: [/highlight]78 yaşında hipertansiyon ile başvuran ancak 6 ay içinde 10 kilo kaybettiğini belirlediğiniz bir hasta düşünelim. Hastamızın hikayesinde eşini 6 ay önce kaybettiğini, iştahsızlığı olduğunu ve 40 paket-yıl sigara içme öyküsü olduğunu belirliyoruz. Ayırıcı tanılarımız bu bulgu ve belirtilere göre öncelikle depresyon, hemen ardından da neoplazi yönünde olacaktır. Bu konuda değerlendirmeler sonuç vermez ve bu tanılar ekarte edilirse ardından yeni ayırıcı tanılar ile malabzorpsiyon gibi daha nadir ve düşük ihtimalli tanılara doğru yönlenilir.[/box]

Olası tanı listesi şekillendikten sonra sıralama yapıp bu tanılara bir olasılık atfetmek işimizi kolaylaştıracaktır. Olası tanılarımızın olasılıkları toplamı 1 olacak şekilde büyükten küçüğe doğru yaptığımız bu liste sayesinde testlerimizi seçeceğiz. [10-12]

Hekimler her bir tanının olasılığını belirlerken birkaç farklı yönteme başvurabilirler. Bu yöntemlerden biri [highlight color=”blue”]“dolaylı ya da sezgisel yaklaşım”[/highlight] diyebileceğimiz, hekimin benzer hastalardaki tecrübesi yardımıyla koymuş olduğu tanıları irdelediği, bu geçmiş bilgilerden de kaba bir olasılık çıkardığı yaklaşımdır. Bu yaklaşım mükemmel değildir, yakın zamanda görülen ya da absürt sonuçlanan vakalar daha rahat hatırlanır ve yeni kanıtlar, çalışmalar ve verileri dikkate almaz. Dahası, bu yaklaşım sadece kendi tecrübelerimizi içerdiğinden ancak kendi bilgimiz dahilinde doğru olabilir. Yeterince benzer vaka görmemiş olmak, konu hakkındaki bilgimizin yetersizliği gibi konulardan etkilenir. Hekimin sezgileriyle şekillenen bu yaklaşımdaki her aşama bias (yanlılık) ve rastlantısal hataya açıktır. [10,13] Eski hocalarımız bu gerçekleri çok öncesinden görmüş olacak ki, büyük kliniklerde hastaların tanı ve tedavilerinin planlanması için [highlight color=”yellow”]“konsey sistemi”[/highlight]ni yerleştirmişlerdir. Cerrahpaşa, Çapa, Hacettepe, Ankara Üniversitesi gibi köklü kurumların ahşap ve tarih kokan amfilerinde genç hekimlerin eksiksiz hale getirmeye çalıştığı dosyalar ile konseye çıkarılan hastaların tanı ve tedavilerinin şekillendiği toplantılar veriye ulaşmanın hiç de kolay olmadığı internet öncesi dönemin bence en önemli kurumlarının başında gelmektedir.

[box type=”note” align=”” class=”” width=””]Her ne kadar tanıdan ziyade tedavi ile ilişkili olsa da konsept olarak buraya uygun bir anımı aktarmak istiyorum: 10 yıl kadar önce bir ACLS kursunda eğitim verirken benden hem yaşça hem de tıbbi tecrübe yılı olarak çok daha büyük bir kursiyer ambulans hekimimiz [highlight color=”yellow”]“kendi tecrübelerine göre”[/highlight] ambulans ve alanda entübasyonun uygun olmadığını belirterek yapmadığını söylemişti. Analitik bakış açısıyla, o yıllarda, bir ambulans hekimi tarafından uygulanan resüsitasyonda alanda da ambulansta da entübasyon olmazsa olmazlardan biri olarak kabul ediliyor ve öğretiliyordu. Dahası, kanıta dayalı tıbbi yeni öğrenen bir genç hekim olarak “tecrübelerime göre” denildiği zaman kulaklarımdan alev çıkmaktaydı. Elbette, birbirimizi ikna edemediğimizi rahatlıkla söyleyebilirim. Ancak, yıl 2016’ya geldiğinde alanda ve ambulansta entübasyondan ziyade göğüs basısının öne çıktığını görüyoruz. Dahası, havayolu açık tutup ventile edilebildiği sürece ambu-maske ile devam etmenin sağkalım üzerinde negatif etkisinin olmadığının, hatta, yeterince tecrübesi olmayan hekim ve sağlık personelinin alanda uyguladığı entübasyonun mortaliteyi arttırdığının gösterildiği verilere sahibiz. Her ne kadar tıbbi olmayan bireysel kaygılarla entübasyon işinin sorumluluğundan kaçmak için böyle bir söylemde bulunduğu önyargımı hâlâ yenemesem de bu anekdot aslında tecrübe ve gözleme de saygı duymam gerektiğini bana hâlâ hatırlatır. Bu hekim arkadaşımızın, yıllar sonra, erken invazif girişim sayesinde sekelsiz iyileştiği anterior MI’a bağlı kardiyak arestinin alanda ilk müdahalesi esnasında kendi meslektaşlarından biri tarafından entübe edildiğini de söylemeden geçemeyeceğim. Bu açıdan, biastan arındırmamızın mümkün olmadığı tecrübe ve sezgilerimizle şekillenen yaklaşımlarımızı biraz analitik verilerle desteklemek yani orta yolu bulmak en doğrusudur diyebiliriz.[/box]

Test öncesi olasılık (pre-test probability)

İnternet sonrası dönemin nimetlerinden faydalanarak tecrübe ve bilgiyi bir araya getirmenin en doğru yol olduğu konusunda hemfikir olduğumuza göre nasıl yapacağımızı biraz irdeleyelim: [highlight color=”blue”]Sezgisel yaklaşımın[/highlight] aksine [highlight color=”blue”]“tamamlayıcı yaklaşım”[/highlight] diyebileceğimiz yöntemle [highlight color=”yellow”]“test öncesi olasılıklarımızı”[/highlight] yayınlanmış verilerden yola çıkarak belirlemeye çalışırız. Uygun bir çalışmada aynı klinik problem tanısal değerlendirme ile incelenmiş ve belirlenen tanıların frekansları bildirilmiş ise bu verileri test öncesi olasılık olarak kullanmak son derece yerinde olacaktır. Bu açıdan gözlemsel kohort çalışmaların aslında ne kadar önemli veriler sağladığını bir kez daha görmüş oluyoruz. Kullanabileceğimiz bir başka uygun çalışma tipi de klinik karar verme kuralları oluşturan çalışmalardır. Bu çalışmaları yürütürken, araştırmacılar, belirli bir klinik probleme sahip hastaları (anoreksi ve kilo kaybı) tanısal değerlendirmeye tabii tuttuktan sonra hastaları hedef durum açısından (bir tanı, mesela malignite, ya da sonlanım, mesela mortalite) farklı tanısal olasılıklara sahip alt gruplara (düşük, orta, yüksek risk) bölmek için istatistiksel yöntemler uygularlar.

Test sonrası olasılık (post-test probability)

Klinik tanı dinamik bir süreçtir. Uygulanan testlerden yeni veriler geldikçe bazı tanıların olasılıkları azalırken diğerleri artar. [highlight color=”yellow”]Olabilirlik Oranları (Likelihood Ratio [LR])[/highlight] yeni verilerin tanısal olasılıkları ne derece değiştireceğini bize bildiren en önemli belirteçlerdir. Test öncesi olasılık, testin sonucuna göre bir test sonrası olasılığa dönüşür. Bu test sonrası olasılık testin pozitif olduğu durumda artarken, negatif olduğu durumda azalır. İşte, test öncesi olasılığın hangi test sonucuna göre ile hangi katsayıyla test sonrası olasılığa dönüştüğünü gösteren sayısal değer (katsayı) bu Olabilirlik Oranlarıdır.

Çoğu zaman hekimlerin tecrübe ile edindikleri sezgileri test sonuçlarının değerlendirmesinde gayet yeterlidir. Ancak bir test sonucunun, ayırıcı tanımızda yer alan bir tanı olasılığını arttırıp azalmasının ne derece güvenilir bir sonuç olduğu sistematik araştırma ve sayısal değerlendirme gerektirir. Bir hastada CRP’nin ya da Beyaz Küre Sayısının belirli bir eşiğin altında (negatif) olması ayırıcı tanılar içinde yer alan bakteriyel pnömoni ihtimalini elbette azaltır. Bu azalmanın anlamlı ve güvenilir olup olmadığı ancak test doğruluğunu gösteren çalışmalar ve bu çalışmaların sistematik derlemelerinin incelenmesiyle kesin olarak söylenebilir.

Tanısal süreçlerde test ve tedavi eşikleri

Bir tanının test öncesi olasılığı test eşiğinin altındaysa o tanı ihtimali test yapılmasını gerektirmeyecek kadar düşüktür. Eğer tedavi eşiğinin üstündeyse o zaman da test yapmaya gerek kalmaksızın tedaviye başlanmalıdır. Bir testin karar verme aşamalarında fayda sağlayabilmesi için teste endikasyon oluşturan tanı ihtimalinin test eşiğinin üstünde, ancak tedavi eşiğinin altında kalan bir oranda olması gerekir. Test sonuçlarının pozitif ya da negatif olmasına göre, o testin olabilirlik oranı (likelihood ratio) nispetinde testin konfirme ettiği tanının olasılığı da artar ya da azalır. Test sonrası olasılık, test öncesi olasılık ile test sonucunun olabilirlik oranının çarpımına eşittir. Test sonrası olasılık da tıpkı test öncesi olasılık gibi tedavi eşiğinin üstünde ise tedaviye başlanır, test eşiğinin altındaysa tanı ekarte edilmiş olur.[14,15] Bu eşiklerin izafi gösterimi aşağıdaki şekilde verilmiştir.

Test ve tedavi eşikleri

[box type=”shadow” align=”aligncenter” class=”” width=””]Bu aşama ve eşiklerin her zaman sayısal olarak hesaplanmasına gerek yoktur. Mesela, patern tanıma yoluyla tanı koyan tecrübeli bir hekim dermatom üzerinde klasik zona döküntülerini gördüğü anda sezgisel olarak test öncesi olasılığının çok yüksek, neredeyse %100’e yakın olduğuna kanaat getirerek tedaviye başlar. Aslında, test öncesi olasılığın tedavi eşiğinden yüksek olduğuna karar vermiştir. Benzer şekilde, aynı hasta yan ağrısı şikayeti ile başvurmuş olsa muayene yapmadan önce renal koliğin yüksek olasılıklı bir tanı olduğunu düşünecektir. Yani, yan ağrısı şikayeti olan bir hastada renal kolik test öncesi olasılığı yüksek olan bir tanıdır. Ama her biri ayrı birer test olan döküntülerin varlığı ve kostovertebral açı hassasiyetinin yokluğu bulguları sonucunda renal kolik için test sonrası olasılık, test eşiğinin altına düşer. Dolayısıyla da renal kolik tanısı koymak ya da ekarte etmek için herhangi bir test yapmaya gerek duymadan bu tanıyı ayırıcı tanı listesinden çıkarır. Keşke, hastalarımızdaki tüm tanıları bu kadar kolaylıkla doğrulayıp ekarte edebilseydik. Ama ne yazık ki, çoğu zaman sezgisel yaklaşımımız yetersiz kalır.[/box]

[highlight color=”yellow”]Peki, bu test ve tedavi eşiklerini nasıl seçiyoruz?[/highlight]

 Bu eşikler testin gücü ve özellikleri, hastalığın prognozu ve tedavinin doğasından direk olarak etkilenir. Test ne kadar ucuz, kolay ve güvenilirse, tanının atlanması ne kadar tehlikeliyse, ve tanı konulursa verilecek tedavi ne kadar ulaşılabilir ve etkinse test eşiğimiz de o kadar düşer. Tersi durumlarda ise test eşiğimizi yüksek tutarız.

[box type=”shadow” align=”aligncenter” class=”” width=””]Örneğin, künt batın travması ile başvuran hastalarda serbest sıvı tespiti için tecrübeli ellerde FAST ile DPL’nin doğruluk, özgüllük ve duyarlılıklarının aynı olduğu gösterilmiştir. Bu sebeple de ATLS, ATACC, BTACC, NICE, KADAT gibi kurs ve kılavuzlar FAST bakısını DPL’nin önüne koymaya başlamıştır.

Peki, elimizde USG cihazı yoksa, FAST yapmaya karar verdiğimiz her hastaya DPL yapmaya da karar verir miydik? Büyük ihtimalle, intrabdominal kanama yönünden test öncesi olasılığımızı bir daha sorgular, ardışık vital ve fizik muayenelerle test öncesi ihtimalimizi düşürmeye ya da yükseltmeye çalışırdık. Elimizde USG varsa FAST için test eşiğimiz düşük, DPL için yüksektir. Bunun sebebi de girişimin invazifliğinden kaynaklanmaktadır.

Az önceki örnekte yer alan 35 yaşındaki karın ağrısı hastasında neredeyse tüm Acil Tıp hekimleri EKG isteyecektir. Çünkü EKG ucuz, non-invazif ve güvenilir bir testtir. Belki yılda 2 en fazla 3 kez görebileceği 35 yaş ve altı AKS’lerden birini yakalamak için tüm hastalara EKG çekilmesi bile anlamlı olabilir. EKG için her türlü ağrıda test eşiği çok ama çok düşüktür.

Yaşlı, immobil, malignite hikayesi olan, nefes darlığı ve yan ağrısı ile başvuran, akciğer filminde infiltrasyon görülmeyen bir hastada pulmoner emboli tanısı için BT anjiyogram test eşiği yüksektir, DMAH ile tedavi eşiği ise kontraendikasyon olmadığı sürece düşüktür. Kontrast nefropatisi ihtimali, hastanın BT’de görüntü verebilip veremeyeceği, yaşlı ve hipoksik bir hastanın gantri içinde monitörizasyonunun zorluğu gibi faktörler bizi hemen anjiyografi order etmekten geri tutarken, bir yandan da aslında test öncesi tanı olasılığımız çok yüksek olduğundan direk tedavi başlayıp başlamamak arasında kalırız. Aslında tedavi eşiğine oldukça yakın bir test öncesi olasılık söz konusudur. Aynı zamanda tedavi seçenekleri kısıtlı, alternatifleri dar ve kesin tedavisi olmayan bir tanı söz konusudur. PE olsa bile belki de sadece DMAH alabilecek olan bu hastada bu sebeple tedavi eşiği iyice düşer ve test eşiğine nerdeyse yaklaşır.

Tam tersine, bazı malignitelerde evreleme laparatomisi adı altında cerrahi, bir tedavi değil tanı testi olarak kullanılır. Malignitelerin tedavisi o kadar zorlu, pahalı, invazif ve komplikedir ki tedavi eşiğimiz neredeyse %100’e yakındır.[/box]

Sezgisel yaklaşımda hekimin çalıştığı ortam ve kliniğin de çok büyük önemi vardır:

[box type=”shadow” align=”aligncenter” class=”” width=””]Örneğin, karın ağrısı şikayeti ile acil servise başvuran 35 yaşında bir hastada Acil Tıp hekiminin aklında prognostik ve probabilistik ayırıcı tanı listeleri aynı anda oluşur. En olası ön tanılar indigesyon, gastroenterit, meteorizm şeklinde başlayıp akut apandisit ile devam etse de, Acil Tıp hekimi [highlight color=”yellow”]“akut MI ya da aritmi de olmasın”[/highlight] demek için eğitilmiştir. Bir Genel Cerrahi hekimi aynı hastada sezgisel olarak önce perforasyon, herni, akut apandisit gibi tanıları elemeye çalışır. Dermatoloji hekimi zona olmadığından emin olmak ister. Bu açıdan her hastada tanının ne olmasını istediğimizi değil ne olabileceğini gözden geçirmemiz, bununla ilgili uygun çalışmalardan olası tanıların frekanslarını değerlendirmemiz çok önemlidir.[/box]

Kaynaklar

  1. Eva KW. What every teacher needs to know about clinical reasoning. Med Educ 2005;39:98–106.
  2. Vijayasekaran D, Ramesh S. Teaching and Assessing Clinical Reasoning Skills. Indian Pediatr 2016;53:175.
  3. Schmidt HG, Norman GR, Boshuizen HP. A cognitive perspective on medical expertise: theory and implication. Acad Med 1990;65:611–21.
  4. Carlos WG, Kritek PA, Clay AS, Luks AM, Thomson CC. Teaching at the Bedside: Maximal Impact in Minimal Time. Ann Am Thorac Soc 2016;:AnnalsATS.201601–018AS.
  5. Rebitschek FG, Bocklisch F, Scholz A, Krems JF, Jahn G. Biased Processing of Ambiguous Symptoms Favors the Initially Leading Hypothesis in Sequential Diagnostic Reasoning. Exp Psychol 2015;62:287–305.
  6. Monteiro SD, Sherbino JD, Ilgen JS, Dore KL, Wood TJ, Young ME, et al. Disrupting diagnostic reasoning: do interruptions, instructions, and experience affect the diagnostic accuracy and response time of residents and emergency physicians? Acad Med 2015;90:511–7.
  7. Croskerry P. A universal model of diagnostic reasoning. Acad Med 2009;84:1022–8.
  8. Ilgen JS, Humbert AJ, Kuhn G, Hansen ML, Norman GR, Eva KW, et al. Assessing diagnostic reasoning: a consensus statement summarizing theory, practice, and future needs. Acad Emerg Med 2012;19:1454–61.
  9. Ilgen JS, Eva KW, Regehr G. What’s in a Label? Is Diagnosis the Start or the End of Clinical Reasoning? J Gen Intern Med Published Online First: 26 January 2016. doi:10.1007/s11606-016-3592-7
  10. Guyatt G. Users’ Guides to the Medical Literature: A Manual for Evidence-Based Clinical Practice, 3E. McGraw Hill Professional  2014.
  11. Felder S, Mayrhofer T. Medical Decision Making. Berlin, Heidelberg: Springer Science & Business Media  2011. doi:10.1007/978-3-642-18330-0
  12. Sox HC, Higgins MC, Owens DK. Medical Decision Making. Chichester, UK: John Wiley & Sons  2013. doi:10.1002/9781118341544
  13. Richardson W. Where do pretest probabilities come from? Evidence-Based Medicine 1999;4:68–9.
  14. Pauker S. The threshold approach to clinical decision making. New England Journal of Medicine 1980;302:1109–17.
  15. Gross R. Making Medical Decisions. ACP Press  1999.
5 Şubat 2020 0 comments
0 FacebookTwitterPinterestEmail
İstatistik yazılarıTATDakademik

Bulguların Değeri: Kırılganlık İndeksi (Fragility index)

by Haldun Akoğlu 5 Şubat 2020
written by Haldun Akoğlu

Kırılganlık indeksi Bayes kuramını temel alarak oluşturulmuş bir indekstir. Temel olarak ikili sonuçların bildirildiği ve 2×2 (4 gözlü) tablo oluşturulan her durumda kullanılabilir. Çalışmada, beklenen sonucun gerçekleşmediği vakaların kaçında sonuç gerçekleşseydi istatistiksel anlamlılık kaybolurdu sorusunun yanıtıdır.

Aşağıdaki 2×2 tabloyu değerlendirelim: 150 deneğin yer aldığı bir çalışmada (gözlemsel ya da randomize kontrollü olabilir) 100 deneğe etkisi değerlendirilen uygulama yapılmış (ilaç, ameliyat ya da farklı bir etki olabilir). Bu 100 denekten 90’ında (%90) başarılı sonuç elde edilmiş. Herhangi bir uygulama yapılmayan 50 kişiden ise 15’inde (%30) başarı gözlenmiş. Bu iki oran arasındaki fark (%90 ile %30) istatistiksel olarak anlamlı bulunmuş.

Peki, yukarıdaki tanıma göre kırılganlık indeksi kaçtır?

Şekil 1. İstatistiksel anlamlı fark tespit edilen örnek 2x2 tablo
Şekil 1. İstatistiksel anlamlı fark tespit edilen örnek 2×2 tablo

Bunun için, beklenen sonucun gerçekleşmediği vakaların sayısını birer birer azaltıp, sonuç gerçekleşenlerin sayısını birer birer arttırıyoruz. Halihazırda vaka gurubunda sonuç gerçekleşenler zaten %90’da olduğundan aradaki farkı azaltmak için bu artırma işlemini az olan sonuç gerçekleşme oranı %30 olan kontrol grubunda yapıyoruz. Kontrol grubunda sonuç gerçekleşen kişi sayısını 15’den 16’ya çıkarırken, sonuç gerçekleşmeyen kişi sayısını 35’den 34’e düşürüp tekrar p değerini hesaplıyoruz. Bu işlemi p değerinin anlamlı kabul edilmediği eşik değerin üzerine çıkana kadar devam ediyoruz.

Aşağıdaki tabloda görüldüğü üzere artık istatistiksel anlamlı fark olmadığına kanaat getireceğimiz p=0,08 değerine 24 kişide sonucun değiştirilmesi ile ulaşıldığını tespit edebiliriz. 50 kişilik kontrol grubunda 15 vakada başarılı sonuç gözlenmiş ve bu sebeple de vaka grubu kontrol grubundan daha iyi çıkmıştı. Eğer kontrol grubunda 24 kişide daha başarılı sonuç gözlenseydi (neredeyse 2,5 katı) aradaki fark anlamsız olacaktı. Burada bulduğumuz 24 sayısı kırılganlık indeksidir. Bu sayıyı elle tabii ki hesaplamıyoruz. http://fragilityindex.com/ adresinde 4 gözlü tablodaki sayıları girerek kolaylıkla kırılganlık indeksini hesaplayabiliriz.

Şekil 2. Kırılganlık indeksini tespit ettiğimiz nokta
Şekil 2. Kırılganlık indeksini tespit ettiğimiz nokta

Bu örnekte bulduğumuz kırılganlık indeksi olan 24, kontrol grubumuzun yarısında sonucunun değişmesi manasına geleceğinden oldukça yüksektir ve bulduğumuz sonucun güvenilir olduğunu gösterir.

Bir örnek: NINDS Çalışması

1995 yılında NEJM dergisinde yayınlanan ve Akut iskemik inmede tPA tedavisiyle ciddi kanama oranının yüksek olduğunu gösteren çalışmalara karşı kurgulanan NINDS çalışmasını ele alalım. NINDS çalışmasının orjinal sonuçlarını aşağıdaki tablo ve şekillerde görebilirsiniz.

Şekil 3. NINDS çalışmasının orjinal sonuçları
Şekil 3. NINDS çalışmasının orjinal sonuçları

Bu çalışmada tPA uygulanan ve uygulanmayan inme hastalarının yüz güldürücü sonuç oranları 4 farklı skala ile değerlendirilmiş. Yazarlar gerçek hasta sayılarını ayrıntısıyla yazıda vermeyi tercih etmemiş ama üreticinin internet sitesinde ve Avrupa İlaç Birliği kayıtlarından halka açık şekilde ulaşmak mümkün. Bu sayıları elde ettiğimizde aşağıdaki tabloyu oluşturabiliyoruz:

Şekil 4. NINDS çalışmasında tedavi gruplarının Barthel İndeksine göre sonlanımlarının karşılaştırılması
Şekil 4. NINDS çalışmasında tedavi gruplarının Barthel İndeksine göre sonlanımlarının karşılaştırılması

Bu tabloya göre tPA verilen (alan) 168 hastadan 84’ü iyi (kabul edilebilir) bir şekilde sonlanmış iken (%50), plasebo verilen (alan) 165 hastadan 62’sinde iyi sonuçlar gözlenmiş (%37.5). Çalışmacılar %50’nin %37.5’den istatistiksel olarak anlamlı derecede yüksek olduğundan yola çıkarak [highlight color=”yellow”]“semptomatik intrakranyal kanama insidansında artışa rağmen, iskemik inmenin ilk 3 saatinde uygulanan IV tPA tedavisi 3 aylık klinik sonlanımları iyileştirmektedir”[/highlight] yorumunu yapmışlar.

Peki, Acil Tıpta inmeye yaklaşımımızı kökünden değiştiren bu çalışmanın kırılganlık indeksi kaçtır?  

http://fragilityindex.com/ adresine gidip sayıları girdiğimizde [highlight color=”yellow”]Kırılganlık İndeksinin sadece 3 vaka olduğunu[/highlight] görüyoruz.

Peki, sizce kontrol grubunda 62 yerine 65 kişinin iyi sonlanıma erişmesiyle sonucu anlamsız hale gelecek bu çalışmaya güvenmeli miyiz?

Ne yazık ki hayır.

Peki, diğer çalışmaların sonuçları neler?

Çoğu çalışma aslında trombolitiklerin fayda sağlamadığını hatta bazıları da zarar verdiğini göstermiş.

E o zaman, 95 yılından beri inme hastalarına boşuna mı trombolitik veriyoruz?

Özel seçilmiş bir hasta grubunda faydalı olabileceklerine ben hala inanıyorum. Ama bu hasta grubu kesinlikle NINDS ya da diğer çalışmaların hasta popülasyonu değil.

Özetle, çalışmanızın sonuçlarını bildirirken kırılganlık indeksinizi de bir hesaplayın. Eğer çok düşük bir indeksiniz varsa yorumlarınızda tutucu olmanız sizin faydanıza olacaktır. Hakemlerinizin yazınızı değerlendirirken kırılganlık indeksi, instabilite indeksi gibi sayıları hesaplayacağını unutmayın.

Şekil 5. Fragilityindex.com sitesinden NINDS çalışma sonuçlarının dökümü
Şekil 5. Fragilityindex.com sitesinden NINDS çalışma sonuçlarının dökümü
Kaynaklar

1 – Fragilityindex.com

5 Şubat 2020 0 comments
0 FacebookTwitterPinterestEmail
Newer Posts
Older Posts

Hakkımızda

  • Üyelik Başvuru Formu
  • Kurumsal Kimliğimiz
  • Gizlilik Politikası

Bize Ulaşın

  • Mustafa Kemal Mahallesi Dumlupınar Blv. No:274 Mahall E Blok Daire:18 Ankara
  • Telefon: (0312) 438 12 66
  • Email: bilgi@tatd.org.tr
@2024 – All Right Reserved. Designed and Developed by Themis
Facebook Twitter Instagram Linkedin Youtube Email
Acil Tıp Akademisi Alt Komisyonu
  • Home
  • 2
  • 9
  • Home 1
  • tdn_pic_1
  • tdn_pic_3
Giriş

Çıkış yapana kadar oturumumu açık tut

Şifrenizi mi unuttunuz?

Password Recovery

A new password will be emailed to you.

Have received a new password? Login here