corpus

/ˈkɔːrpəs/

意味

集成、言語資料

例文

ALX-9000 misfiled the glitter corpus again.
ALX-9000はまたキラキラ資料集を誤分類した。

言葉のよくある組み合わせ

corpus linguistics(コーパス言語学), text corpus(テキストコーパス), corpus analysis(コーパス分析)

定義

言語や文章の研究のために集められた大量のテキストデータの集まり。

頻度

corpus は約200,000語に1回程度の頻出度です。

分析(口語性・形式性・抽象度・感情度/感情分析)

口語性、形式性、抽象度、感情度

水平グラフ: 会話での使われやすさ、フォーマル度、抽象度(具体・概念)、感情度を示します。数値が高いほど、その特徴が強いことを表します。

感情分析

レーダーチャート: 怒り、期待、嫌悪、恐れ、喜び、悲しみ、驚き、信頼、ポジティブ、ネガティブの強さを示します。

※上記分析結果を比較・スコアリングした上で抽出

年代別単語頻度グラフ

このグラフは、1900年からの単語出現頻度の推移を示しています。値は ×10⁻⁸ スケールで表示されています。

この曲線は、2006年付近に山があり、近年は昔の約1.3倍で現れやすいように見えます。 時代をまたいで粘り強い語彙に見えます。 大勢としては大崩れせず、用途が分散しているタイプかもしれません。 昔は1960?70年代に峯が立ち(平均ピーク年が約1967年、中央値は1981年)、今は1990年代以降のデジタル/グローバル期に別の波が増えているように見えます。情報流通が広がり、専門・地域語彙が一般にも届きやすくなった時代と共鳴しているように見えます。 ただ、頻度の形が示す“時代との相性”は、偶然以上のものを感じさせることがあります。 こういう“時代の匂い”と一緒に覚えると、単語がぐっと立体的に見えてくるはずです。
※1900年以降の頻度推移を比較した上で抽出

他の単語も探したい方はこちらの 英単語絞り込み検索ページ をご覧ください。

Definitions(定義)

Noun: capital as contrasted with the income derived from it
Noun: a collection of writings
Noun: the main part of an organ or other bodily structure

Parts of Speech(品詞)

Noun

Examples(例文)

感情分析に使用された例文:

The linguist analyzed a large corpus of ancient texts.(言語学者は古代の文献の大規模なコーパスを分析した。)
This corpus contains valuable data for language research.(このコーパスには言語研究に役立つ貴重なデータが含まれている。)
She compiled a corpus to study regional dialects.(彼女は地域方言を研究するためにコーパスを作成した。)

 

Word Netから抽出した例文:

Noun: he edited the Hemingway corpus

Synonyms/Antonyms(類語/反意語)

Synonyms(類語): corpus, principal, principal sum

Antonyms(反意語):

Hypernyms/Hyponyms(上位語/下位語)

Hypernyms (General categories)(上位語): capital, collection, part

Coordinate Terms(同じ上位語をもつもの): acicula, agglomeration, ana, armamentarium, art collection, asia, assortment, aviation, backlog, base, batch, battery, biota, block, body part, book, bottle collection, bunch, central america, class, coin collection, collage, combination, congregation, content, convoy, corner, corpus, craton, crop, cutting, data, defense, endowment, ensemble, europe, exhibition, fauna, findings, flagging, fleet, flinders, fragment, free world, galaxy, generally accepted accounting principles, gimmickry, hand, herbarium, hit parade, hunk, job lot, judaica, kludge, law, library, long suit, mail, mass, means, menagerie, mythology, north america, nub, nuclear club, oort cloud, pack, package, pantheon, petting zoo, pharmacopoeia, pile, planting, population, principal, procession, prosecution, repertoire, repertory, rogue’s gallery, segment, set, signage, slice, smithereens, south america, stamp collection, statuary, string, strip, sum, tenantry, third world, traffic, treasure, treasure trove, trinketry, troponymy, vegetation, victoriana, wardrobe, world

Hyponyms (Specific examples)(下位語):

Derivationally Related Words(派生語)

Derivationally Related Words:

Categories(カテゴリー)

Domain Categories: economics, science

Usage Category: common

Usage Context: general

Grammatical Notes:

Prefixes/Suffixes(接頭辞/接尾辞)

Prefixes(接頭辞): co

Suffixes(接尾辞): s

Exam Level

英検1級

Media Appearance(メディア登場例)

Books(洋書):

Movies(映画):

Other Information(その他)

Is Abstract?(抽象的な言葉?) No

Is Emotion Word?(感情的な言葉?) No

Emotion Categories:

If you like this article, please
Follow !

Let's share this post !
  • Copied the URL !