Cara Menggunakan Alat Penampil Ngram di Google Buku

Daftar Isi:

Cara Menggunakan Alat Penampil Ngram di Google Buku
Cara Menggunakan Alat Penampil Ngram di Google Buku
Anonim

Yang Perlu Diketahui

  • Di Penampil Ngram Google Buku, ketik frasa, pilih rentang tanggal dan korpus, atur level perataan, dan klik Cari banyak buku.
  • Anda dapat menelusuri data. Misalnya, untuk mencari bentuk kata kerja ikan, alih-alih kata benda ikan, gunakan tag: search for fish_VERB.
  • Ngram Viewer mengeluarkan grafik yang mewakili penggunaan frasa sepanjang waktu. Untuk beberapa frasa, masing-masing diwakili oleh garis berkode warna.

Artikel ini menjelaskan cara menggunakan alat Ngram Viewer di Google Buku untuk melakukan penelitian dan penelusuran daya.

Image
Image

Cara Kerja Penampil Ngram

An Ngram, juga disebut N-gram, adalah analisis statistik konten teks atau ucapan untuk menemukan n (angka) dari beberapa jenis item dalam teks.

Item pencarian bisa bermacam-macam, termasuk fonem, awalan, frasa, dan huruf. Meskipun Ngram tidak jelas di luar komunitas riset, Ngram digunakan di berbagai bidang dan memiliki banyak implikasi bagi pengembang yang mengkode program komputer yang memahami dan merespons bahasa lisan alami.

Dalam kasus Penampil Ngram Google Buku, teks yang akan dianalisis berasal dari sejumlah besar buku dalam domain publik yang dipindai Google untuk mengisi mesin pencari Google Bukunya. Untuk Google Books Ngram Viewer, Google mengacu pada badan teks yang akan Anda cari sebagai corpus. Ngram Viewer dikumpulkan berdasarkan bahasa, meskipun Anda dapat menganalisis bahasa Inggris Inggris dan Amerika secara terpisah atau menyatukannya.

  1. Buka Penampil Ngram Google Buku di books.google.com/ngrams.
  2. Ketik frasa atau frasa apa pun yang ingin Anda analisis. Pisahkan setiap frasa dengan koma. Google menyarankan, "Albert Einstein, Sherlock Holmes, Frankenstein" untuk membantu Anda memulai.

    Dalam penelusuran NGram Viewer, item peka huruf besar/kecil, tidak seperti penelusuran web Google.

  3. Pilih rentang tanggal. Standarnya adalah 1800 hingga 2000.
  4. Pilih korpus. Anda dapat mencari teks bahasa asing atau teks bahasa Inggris, dan selain pilihan standar, Anda mungkin melihat entri seperti "Bahasa Inggris (2009)" atau "Bahasa Inggris Amerika (2009)" di bagian bawah daftar. Ini adalah korpora lama yang telah diperbarui oleh Google, tetapi Anda mungkin memiliki beberapa alasan untuk membuat perbandingan dengan kumpulan data lama. Sebagian besar pengguna dapat mengabaikannya dan fokus pada corpora terbaru.
  5. Setel level perataan. Smoothing mengacu pada seberapa halus grafik di akhir. Representasi yang paling akurat mencerminkan tingkat penghalusan 0, tetapi pengaturan itu mungkin sulit dibaca. Standarnya diatur ke 3. Dalam kebanyakan kasus, Anda tidak perlu menyesuaikannya.

  6. Tekan Cari banyak buku.

Menggunakan Ngram Viewer Google, Anda dapat menelusuri data. Jika Anda ingin mencari kata kerja ikan alih-alih kata benda ikan, Anda dapat melakukannya dengan menggunakan tag. Dalam hal ini, Anda akan mencari fish_VERB.

Google menyediakan daftar lengkap perintah, dokumentasi lanjutan lainnya untuk digunakan dengan Ngram Viewer di situs webnya.

Intisari

Google Books Ngram Viewer mengeluarkan grafik yang mewakili penggunaan frasa tertentu dalam buku sepanjang waktu. Jika Anda memasukkan lebih dari satu kata atau frasa, masing-masing kata atau frasa diwakili oleh garis berkode warna agar kontras dengan istilah penelusuran lainnya. Ini mirip dengan Google Trends, hanya pencarian yang mencakup periode yang lebih lama.

Studi Kasus

Pertimbangkan studi kasus pai cuka. Mereka disebutkan dalam serial Rumah Kecil Laura Ingalls Wilder di Prairie. Menjelajahi dengan pencarian web Google untuk mempelajari lebih lanjut tentang pai cuka mengungkapkan bahwa mereka dianggap sebagai bagian dari masakan Amerika Selatan dan memang dibuat dengan cuka. Mereka mendengarkan kembali saat-saat ketika tidak semua orang memiliki akses ke produk segar sepanjang tahun, tetapi apakah itu keseluruhan ceritanya?

Telusuri Google Ngram Viewer untuk pai cuka, dan Anda akan menemukan beberapa penyebutan pai di awal dan akhir 1800-an, banyak penyebutan di tahun 1940-an, dan semakin banyak penyebutan belakangan ini. Namun, dengan tingkat pemulusan 3, Anda melihat dataran tinggi di atas penyebutan di tahun 1800-an. Karena tidak banyak buku yang diterbitkan selama waktu itu dan karena data diatur ke smooth, gambarnya terdistorsi. Mungkin hanya satu buku yang menyebutkan pai cuka, dan itu dirata-ratakan untuk menghindari lonjakan. Dengan menyetel penghalusan ke 0, Anda dapat melihat bahwa inilah masalahnya. Lonjakan berpusat pada tahun 1869, dan ada lonjakan lain pada tahun 1897 dan 1900.

Sepertinya tidak ada yang membicarakan tentang pai cuka sepanjang waktu: Mungkin ada resep yang beredar di mana-mana, tetapi orang-orang tidak menulisnya di buku, dan itu adalah batasan penting dari pencarian Ngram.

Direkomendasikan: