Portaal vannitoa renoveerimise kohta. Kasulikud näpunäited

Kasutamise sagedus. Mida tähendavad tähendusliku sõnavara sõnastikus näitajad frq1, frq2 ja LL-skoor

Kasutamise sagedus

nimisõna, sünonüümide arv: 1

kasutamine (10)


  • - Sõnavara, mille kasutamine on teatud põhjustel piiratud. keelevälised põhjused. Et L.o.u. Siia kuuluvad: dialektismid, terminid ja professionaalsused, žargoon, kõnekeelsed sõnad ja väljendid, vulgarismid...

    Sotsiolingvistiliste terminite sõnastik

  • Üldkeeleteadus. Sotsiolingvistika: Sõnastik-teatmik

  • - saksakeelse termini Gebrauchstypen tõlge, mille võttis kasutusele Delbrück, et tähistada grammatiliste vormide väljakujunenud kasutusviise. T.-le üles. hõlmavad näiteks erinevat tüüpi süntaktilist kasutust...

    Brockhausi ja Euphroni entsüklopeediline sõnaraamat

  • - Sõnavara, mille kasutamist piiravad keelevälised põhjused: 1) territoriaalselt piiratud dialektikad; 2) teaduslikus stiilis kasutatavad terminid...
  • Keeleterminite sõnastik T.V. Varss

  • Keeleterminite sõnastik T.V. Varss

  • - Kasutusviisid, mis keelavad ühe objekti erinevuse kasutamise: elusorganismid ei saa eksisteerida ilma...
  • - Kasutusalad, mis korreleeruvad antud objektiklassi konkreetsete esindajatega: ma pean seda inimest nägema...

    Üldmorfoloogia terminid ja mõisted: Sõnastik-teatmik

  • - 1) Keeruliste mitteliituvate lausete vormistamise reeglitega ette nähtud võimalused: selgitamisel või motiveerimisel võib kooloni asemel kasutada mõttekriipsu: Eraldamine on illusoorne - varsti oleme koos...

    Süntaks: sõnastik

  • - määrsõna, sünonüümide arv: 1 peidetud...

    Sünonüümide sõnastik

  • - adj., sünonüümide arv: 10 avaldatud, aegunud, ei vasta tänapäeva nõuetele, aegunud, vananenud, taandatud legendi valdkonda...

    Sünonüümide sõnastik

  • - cm...

    Sünonüümide sõnastik

  • - adj., sünonüümide arv: 19 anakronistlik arhailine arhailine aegunud aegunud vananenud aegunud lagunenud vananenud aegunud aegunud vananenud piirkonda...

    Sünonüümide sõnastik

  • - adj., sünonüümide arv: 2 ei sobi kasutamiseks aeg-ajalt...

    Sünonüümide sõnastik

  • - adj., sünonüümide arv: 3 jäänud kasutamata panna kõrvale panna katte alla...

    Sünonüümide sõnastik

  • - 1) Keeruliste mitteliituvate lausete vormistamise reeglitega ette nähtud võimalused: selgitamisel või motiveerimisel võib kooloni asemel kasutada mõttekriipsu: Eraldamine on illusoorne - oleme varsti koos 2) Isolatsiooniga...

    Keeleterminite sõnastik T.V. Varss

"kasutamise sagedus" raamatutes

Söötmise sagedus

autor Harmar Hillery

Söötmise sagedus

autor Harmar Hillery

Söötmissagedus Kutsika jaoks vajalik söötmiste arv päevas oleneb tõu suurusest. Enamik kutsikaid areneb hästi, kui neid toidetakse iga kolme tunni järel päeval ja öösel, kuid kui nad sündisid enneaegselt või kaalusid sündides alla 85 g, siis tõenäoliselt

Söötmise sagedus

Raamatust Aretuskoerad autor Harmar Hillery

Söötmissagedus Kutsika jaoks vajalik söötmiste arv päevas oleneb tõu suurusest. Enamik kutsikaid areneb hästi, kui neid toidetakse iga kolme tunni järel päeval ja öösel, kuid kui nad sündisid enneaegselt või kaalusid sündides alla 85 g, siis tõenäoliselt

Söötmise sagedus

Raamatust Koerad ja nende aretamine [Koerakasvatus] autor Harmar Hillery

Söötmissagedus Kutsika jaoks vajalik söötmiste arv päevas oleneb tõu suurusest. Enamik kutsikaid areneb hästi, kui neid toidetakse iga kolme tunni järel päeval ja öösel, kuid kui nad sündisid enneaegselt või kaalusid sündides alla 85 g, siis tõenäoliselt

Sagedus

Raamatust Kinnisvara. Kuidas seda reklaamida autor Nazaikin Aleksander

14.2.3. Interaktsiooni sagedus

autor Dimitri Nicola

14.2.3. Interaktsiooni sagedus Mida sagedamini üks ja sama rühm konkurente suhtleb, seda jätkusuutlikumaks muutub kokkumäng, kuna rikkumiste eest karistatakse kiiremini. Kui näiteks ettevõtted konkureerivad harvemini, on nende võime kokkumängu säilitada madalam.

15.4.6. Oksjoni sagedus

Raamatust Ostujuhend autor Dimitri Nicola

15.4.6. Oksjonite sagedus Nagu eespool mainitud, võivad mõned oksjoniringid pärast oksjonit, mille osas nad on kokku leppinud, rahalisi vahendeid omavahel üle kanda või võivad tasumisele kuuluvate summade kohta arvestust pidada ainult aeg-ajalt.

8. Funktsioonisõnade kasutussagedus osutub autori muutumatuks

Raamatust Raamat 2. Muudame kuupäevi – kõik muutub. [Kreeka ja Piibli uus kronoloogia. Matemaatika paljastab keskaegsete kronoloogide pettuse] autor Fomenko Anatoli Timofejevitš

8. Funktsioonisõnade kasutussagedus osutub autori muutumatuks Märkimisväärseks erandiks on meie parameeter 3 – kõigi funktsioonisõnade kasutussagedus – EESMÄRGID, SIDEMED JA OSAKESED. Kuvatakse selle parameetri areng sõltuvalt valimi suuruse kasvust

Sagedus

Autori raamatust Great Soviet Encyclopedia (CA). TSB

Sagedus

autor Nazaikin Aleksander

Sagedus

Raamatust Media Planning for 100 autor Nazaikin Aleksander

Sagedus Telekanaleid edastatakse meeter- ja detsimeetersagedustel. Arvestite vahemikud olid esimesed, mida televisioonis meisterdati. 20. sajandi 90ndatel hakkasid Moskvas aktiivselt tööle detsimeeterkanalid, varem oli sagedusel oluline tähtsus, kuna erinevate kanalite vastuvõtuks.

Sagedus

Raamatust Media Planning for 100 autor Nazaikin Aleksander

Sagedus Signaali edastamise sagedus määrab selle kvaliteedi. Suuremal määral on see VHF-sagedusalades (sagedusmodulatsioon FM). Kuulajad eelistavad head heli, mistõttu on VHF-jaamadel märkimisväärne vaatajaskonna reiting ja neid eelistatakse

3.2. Sagedus

autor Ivanov Dmitri Olegovitš

3.2. Sagedus Rääkides mistahes patoloogia olulisusest meditsiinis, on meie arvates oluline rääkida mitte ainult tekkinud või tekkida võivate vigastuste ja tüsistuste etioloogiast, patogeneesist, kliinilisest pildist ja tõsidusest, vaid ka vigastuste ja tüsistuste tõsidusest. Selle patoloogia levimus. TO

4.2. Sagedus

Raamatust Vastsündinute soojustasakaalu häired autor Ivanov Dmitri Olegovitš

4.2. Sagedus Hüpertermia vastsündinutel on tõenäoliselt palju harvem kui hüpotermia. Tõenäoliselt on see tingitud asjaolust, et teaduskirjanduses on imikute hüpertermia kohta äärmiselt vähe uuringuid. Maayan-Metzger A. et al. (2003) analüüsisid 42 313 juhtumiaruannet

Sagedus

Raamatust Glükoosi metabolismi häired vastsündinutel autor Ivanov Dmitri Olegovitš

Sagedus Corblant M., kes määratles hüpoglükeemia kui vere glükoosisisalduse alla 30 mg% (1,67 mmol/l) esimese 72 elutunni jooksul, leidis selle 4,4% kõigist elussündidest.1971. aastal leidsid Lubchenco L. O. ja Bard N., kasutades Corblant M. kriteeriume, tuvastas hüpoglükeemia vastsündinutel, kellel on suurem

Kirjutasin naljaka PHP-skripti. Lasin keele kontrollimiseks läbi kõik Spectatori tekstid. Kokku on tekstides kasutatud 39 110 erinevat sõnavormi. Mitu erinevat täpselt? sõnad- üsna raske määrata. Et sellele joonisele vähemalt kuidagi lähemale jõuda, võtsin ainult sõna esimesed 5 tähte ja võrdlesin neid. Tulemuseks oli 14 373 sellist kombinatsiooni. Oleks veniv nimetada seda sõnavaraks "Pealtvaataja".

Seejärel võtsin sõnad kätte ja uurisin nende tähtede kordumise sagedust. Ideaalis peate pildi täiendamiseks võtma mingi sõnaraamatu. Te ei saa tekste käivitada, vajate ainult ainulaadseid sõnu. Tekstis korratakse mõnda sõna sagedamini kui teisi. Seega saadi järgmised tulemused:

o - 9,28%
a - 8,66%
e - 8,10%
ja – 7,45%
n – 6,35%
t - 6,30%
p - 5,53%
s – 5,45%
l - 4,32%
sisse – 4,19%
k - 3,47%
n – 3,35%
m - 3,29%
a – 2,90%
d – 2,56%
I - 2,22%
s – 2,11%
b – 1,90%
z – 1,81%
b – 1,51%
g – 1,41%
th - 1,31%
h - 1,27%
jü - 1,03%
x – 0,92%
f – 0,78%
kaal - 0,77%
c – 0,52%
sch - 0,49%
f – 0,40%
e - 0,17%
ъ - 0,04%

“Imede väljale” minejatel soovitan see tabel pähe õppida. Ja nimetage sõnad selles järjekorras. Näiteks näib, et sellist "tuttavat" tähte "b" kasutatakse harvemini kui "haruldast" tähte "s". Samuti peame meeles pidama, et sõnas on rohkem kui üks täishäälik. Ja et kui arvasid ära ühe vokaali, siis pead hakkama järgima kaashäälikuid. Ja pealegi arvatakse sõna täpselt selle kaashäälikute järgi. Võrdle: „**a**i*e” ja „sr*vn*t*”. Mõlemal juhul on sõna "võrdle".

Ja veel üks kaalutlus. Kuidas sa inglise keelt õppisid? Mäletad? E pliiats, e pliiats, e laud. See, mida ma näen, on see, millest ma laulan. Mis mõte sellel on?.. Kui sageli ütlete tavaelus sõna "pliiats"? Kui ülesandeks on õpetada võimalikult kiiresti ja tõhusalt rääkima, siis tuleb ka vastavalt õpetada. Analüüsime keelt ja toome välja enamkasutatavad sõnad. Ja me hakkame neilt õppima. Et enam-vähem inglise keelt rääkida, piisab vaid poolteise tuhandest sõnast.

Veel üks turgutus: moodustada tähtedest sõnu juhuslikult, kuid arvestades esinemissagedust, et see näeks välja nagu tavalised sõnad. Esimese kümne "juhusliku" neljatähelise sõna hulgas hüppas välja "eesel". Järgmises viiekümnes - sõnad "tormamine" ja "NATO". Kuid paraku on palju dissonantseid kombinatsioone, nagu “bltt” või “nrro”.

Seega - järgmine samm. Jagasin kõik sõnad kahetähelisteks kombinatsioonideks ja hakkasin neid suvaliselt kombineerima (aga arvestades kordussagedust). Teras suurtes kogustes tekitab sõnu, mis on sarnased "tavalisele". Näiteks: "koivdiot", "voabma", "apy", "depoid", "debyako", "orfa", "poesnavy", "ozza", "chenya", "retoria", "urdeed", "utoichi" , "stikh", "sapot", "gravda", "ababap", "obarto", "eleuet", "lyarezy", "myni", "bromomer" ja isegi "todebyst".

Kuhu kandideerida... valikuid on. Näiteks kirjutage ilusate kaubamärgiga mänguliste nimede generaator. Jogurtide jaoks. Nagu "memoliso" või "utororerto". Või - ​​futuristlike luuletuste generaator "Burliuk-php": "opeldiy miaton, linoaz okmiaya... deesopen odesson."

Ja on veel üks võimalus. Vaja proovida...

Mõned statistikad vene sõnade kasutamise kohta:

  • Sõna keskmine pikkus on 5,28 tähemärki.
  • Keskmine lause pikkus on 10,38 sõna.
  • 1000 sagedasemat lemmat katavad 64,0708% tekstist.
  • 2000 sagedasemad lemmad hõlmavad 71,9521% tekstist.
  • 3000 sagedasemat lemmat katavad 76,5104% tekstist.
  • 5000 sagedasemat lemmat katavad 82,0604% tekstist.

Pärast teadet sain järgmise kirja:


Tere Dmitri!

Pärast artikli „Keel toob teid Kiievisse“ ja selle osa analüüsimist, kus te oma programmi kirjeldate, tekkis idee.
Sinu kirjutatud stsenaarium tundub mulle olevat mõeldud absoluutselt mitte suuremal määral “Imede väljale”, vaid millelegi muule.
Esimene kõige mõistlikum skripti tulemuste kasutamine on mobiilseadmete nuppude programmeerimisel tähtede järjekorra määramine. Jah, jah - seda kõike on vaja mobiiltelefonides.

Ma jaotasin selle lainetena ()

Järgmine on jaotus nuppude järgi:
1. Kõik esimese laine tähed lähevad esimese rea 4 nupule
2. Kõik teise laine tähed on ka ülejäänud 4 nupul samas esimeses reas
3. Kõik kolmanda laine tähed lähevad ülejäänud kahele nupule
4. Teisele reale lähevad 4,5 ja 6 lainet
5. 7,8,9 lainet lähevad kolmandasse ritta ja 9. laine läheb täielikult (vaatamata näiliselt suurele tähtede arvule) 9. nupu kolmandale reale, nii et 10. nupp jääb kõikvõimalike kirjavahemärkide jaoks. märgid (punkt, koma jne).

Ma arvan, et kõik on selge ilma üksikasjalike selgitusteta. Kuid siiski, kas saaksite oma skriptiga (sh kirjavahemärkidega) töödelda järgmisi tekste:

Ja siis postitada statistika? Mulle tundus? et tekstid peegeldaksid võimalikult palju meie tänapäevast kõnet ja ometi me nii räägime kui kirjutame SMS-e.

Tänan teid juba ette.

Niisiis on tähtede kordumise sageduse analüüsimiseks kaks võimalust. Meetod 1. Võtke tekst, leidke sellest ainulaadsed (mittekorduvad) sõnavormid ja analüüsige neid. Meetod sobib hästi venekeelsete sõnade, mitte tekstide põhjal statistika koostamiseks. Meetod 2. Ärge otsige tekstist ainulaadseid sõnu, vaid minge otse tähtede kordumise sageduse loendamiseni. Saame tähtede sageduse venekeelses tekstis, mitte venekeelsetes sõnades. Klaviatuuride ja muude asjade loomiseks peate kasutama täpselt seda meetodit: tekstid sisestatakse klaviatuuril.

Klaviatuurid peaksid arvestama mitte ainult tähtede sagedusega, vaid ka kõige püsivamate sõnadega (sõnavormidega). Pole nii raske ära arvata, milliseid sõnu kõige sagedamini kasutatakse: need on esiteks ametnik kõneosad, sest nende roll on teenida alati ja kõikjal, ja asesõnad, mille roll pole vähem oluline: asendada kõnes mis tahes asja/isikut (see, ta, ta). Noh, peamised tegusõnad (olema, ütlema). Ülalloetletud tekstide analüüsi tulemuste põhjal sain järgmised “populaarsed” sõnad: “and, not, in, that, he, I, on, with, she, how, but, his, this, to , a, kõik, tema, oli, nii, siis, ütles, for, sina, oh, at, tema, mina, ainult, for, mina, jah, sina, alates, oli, millal, alates, jaoks, ikka, nüüd , nad, ütlesid, juba, tema, ei, oli, tema, olla, noh, ega, kui, väga, mitte midagi, siin, ise, nii et, endale, see, võib-olla, see, enne, meie, nemad, kas, olid, on, kui või, tema” ja nii edasi.

Tulles tagasi klaviatuuride juurde, on ilmne, et klaviatuuris peaksid tähekombinatsioonid “mitte”, “mis”, “tema”, “sees” ja teised olema üksteisele võimalikult lähedal või kui mitte lähedal, siis mõnes optimaalses tee. Tuleb uurida, kuidas täpselt sõrmed klaviatuuril liiguvad, leida kõige “mugavamad” asendid ja paigutada neisse enamkasutatavad tähed, unustamata aga tähekombinatsioone.

Probleem, nagu alati, on üks: isegi kui on võimalik luua unikaalne klaviatuur, mis saab miljonitest inimestest, kes on qwerty/ytsukeniga juba harjunud?

Mis puudutab mobiilseadmeid... Küllap on sellel mõtet. Vähemalt peavad tähed "o", "a", "e" ja "i" olema täpselt samal klahvil. Kirjavahemärgid kasutussageduse järjekorras: , . - ? ! "; :) (

- — Teemad infokaitse ET sõnakasutuse sagedus … Tehniline tõlkija juhend

Y; sagedused; ja. 1. kuni Sagedane (1 number). Jälgige liigutuste kordamise sagedust. Nõutav osa kartulite istutamisest. Pöörake tähelepanu oma pulsisagedusele. 2. Ühesuguste liigutuste korduste arv, võnkumised mis suunas. ajaühik. Ratta pöörlemise tunnid. H... entsüklopeediline sõnaraamat

I Alkoholism on krooniline haigus, mida iseloomustab süstemaatilisest alkoholi kuritarvitamisest tingitud psüühika- ja somaatiliste häirete kombinatsioon. A. x olulisemad ilmingud. on muutunud vastupidavus ... ... Meditsiiniline entsüklopeedia

PIDAMINE- üks spetsiifilistest terminitest, mida kasutatakse vene konksuplaatides. mittelineaarne polüfoonia, mida iseloomustab arenenud subvokaalne polüfooniline struktuur ja vertikaali terav dissonants. Laulmine mõiste rakendamine tänapäeval. aega pole uuritud... Õigeusu entsüklopeedia

Tekstianalüüsi stilistatiline meetod- on matemaatilise statistika vahendite kasutamine stilistika valdkonnas, et määrata kindlaks kõnes funktsioneerivad keeletüübid, keele toimimise mustrid erinevates suhtlussfäärides, tekstitüübid, spetsiifilised funktsionaalsused. stiilid ja...

Portsjonitega maitsestatud huuletubakas, miniportsjon Huuletubakas on teatud tüüpi tubakatoode. See on purustatud niisutatud tubakas, mis asetatakse ülemise (harvemini alumise) huule ja igeme vahele... Wikipedia

Teaduslik stiil- esitleb teaduslikku. teaduse kui sotsiaalse teadvuse vormi rakendamisega seotud suhtlus- ja kõnetegevuse valdkond; peegeldab kontseptuaalselt loogilisel kujul esinevat teoreetilist mõtlemist, mida iseloomustab objektiivsus ja abstraktsus... Vene keele stilistiline entsüklopeediline sõnaraamat

- (erialakirjanduses ka isanimi) perekonnanime osa, mis omistatakse lapsele isa nime järgi. Isanimede variatsioonid võivad nende kandjaid ühendada kaugemate esivanemate, vanaisade, vanavanaisadega... ... Wikipedia

Üldkasutus, rakendatavus, levimus, rakendatavus, turustatavus, üldtunnustatud vene sünonüümide sõnastik. kasutus nimisõna, sünonüümide arv: 10 üldtunnustatud (11) ... Sünonüümide sõnastik

Arutluskäik- - funktsionaalselt semantiline kõnetüüp (vt) - (FSTR), mis vastab abstraktse mõtlemise vormile - järeldamine, spetsiaalse kommunikatiivse ülesande täitmine - anda kõnele põhjendatud iseloom (jõuda loogiliselt uuele otsusele või ... ... Vene keele stilistiline entsüklopeediline sõnaraamat

Tahaksin teid hoiatada, et selles artiklis esitatud teave on mõnevõrra aegunud. Ma ei kirjutanud seda ümber, et saaksin hiljem võrrelda, kuidas SEO standardid ajas muutuvad. Selle teema kohta saate värsket teavet uutest materjalidest:

Tere, kallid ajaveebisaidi lugejad. Tänane artikkel on taas pühendatud sellisele teemale nagu veebisaitide otsingumootoritele optimeerimine (). Varem oleme juba puudutanud paljusid küsimusi, mis on seotud sellise kontseptsiooniga nagu.

Täna tahan jätkata vestlust sisemise SEO teemal, selgitades samas mõnda varem tõstatatud punkti, ning rääkida ka sellest, mida me pole veel arutanud. Kui suudate kirjutada häid unikaalseid tekste, kuid ei pööra piisavalt tähelepanu sellele, kuidas otsingumootorid neid tajuvad, siis ei jõua nad teie imelise teemaga seotud päringute otsingutulemuste tippu. artiklid.

Mis mõjutab teksti asjakohasust otsingupäringu jaoks?

Ja see on väga kurb, sest nii ei realiseeri te oma projekti täit potentsiaali, mis võib osutuda väga muljetavaldavaks. Peate mõistma, et otsingumootorid on enamasti rumalad ja otsekohesed programmid, mis ei suuda ületada oma võimalusi ja vaadata teie projekti inimsilmaga.

Nad ei näe palju kõike, mis on teie projektis hea ja vajalik (mille olete külastajatele ette valmistanud). Nad oskavad vaid teksti analüüsida, võttes arvesse paljusid komponente, kuid inimtaju on nad siiski väga kaugel.

Seetõttu peame vähemalt ajutiselt ronima otsingurobotite kingadesse ja mõistma, millele nad keskenduvad erinevate otsingupäringute jaoks erinevate tekstide järjestamisel (). Ja selleks peab teil olema idee, selleks peate lugema esitatud artiklit.

Tavaliselt püütakse kasutada märksõnu lehe pealkirjas, mõnes sisemises pealkirjas ning jaotada need ühtlaselt ja võimalikult loomulikult kogu artikli ulatuses. Jah, loomulikult võib kasutada ka tekstis esiletõstmise klahve, kuid ei tasu unustada liigset optimeerimist, mis võib tulemuseks olla.

Klahvide tihedus tekstis on samuti oluline, kuid praegu pole see pigem soovitav tegur, vaid vastupidi, hoiatus - sellega ei tasu üle pingutada.

Märksõna esinemise tiheduse määramine dokumendis on üsna lihtne. Tegelikult on see selle kasutamise sagedus tekstis, mis määratakse, jagades selle esinemiste arvu dokumendis dokumendi pikkusega sõnades. Varem sõltus saidi positsioon otsingutulemustes sellest otseselt.

Kuid ilmselt saate aru, et kogu materjali ei ole võimalik ainult võtmete järgi koostada, sest see on loetamatu ja jumal tänatud, et see pole vajalik. Miks sa küsid? Jah, sest märksõna kasutamise sagedusel tekstis on piirang, mille järel ei suurene enam dokumendi asjakohasus seda märksõna sisaldava päringu jaoks.

Need. Meile piisab teatud sageduse saavutamisest ja seega optimeerime seda nii palju kui võimalik. Või pingutame üle ja jääme filtri alla.

Jääb lahendada kaks küsimust (ja võib-olla kolm): milline on see märksõna esinemise maksimaalne tihedus, pärast mida on juba ohtlik seda suurendada, ja ka välja selgitada.

Tõsiasi on see, et rõhumärgenditega esile tõstetud ja TITLE-sildis sisalduvatel märksõnadel on suurem otsingukaal kui sarnastel lihtsalt tekstis esinevatel märksõnadel. Kuid hiljuti on veebihaldurid hakanud seda kasutama ja on selle teguri täielikult rämpsposti saatnud, mistõttu selle tähtsus on vähenenud ja võib tugevate külgede kuritarvitamise tõttu isegi kogu saidi keelustada.

Kuid TITLE võtmed on endiselt asjakohased, parem on neid seal mitte korrata ega püüda ühe lehe pealkirjaga liiga palju kokku toppida. Kui märksõnad on pealkirjas, siis saame nende arvu artiklis oluliselt vähendada (ja seega muuta selle hõlpsasti loetavaks ja inimestele, mitte otsingumootoritele sobivamaks), saavutades sama asjakohasuse, kuid ilma riskita alla sattuda. filter.

Arvan, et selle küsimusega on kõik selge – mida rohkem võtmeid on aktsendi- ja TITLE siltide vahel, seda suurem on võimalus kõik korraga kaotada. Aga kui te neid üldse ei kasuta, siis ei saavuta te ka midagi. Kõige olulisem kriteerium on märksõnade teksti sissetoomise loomulikkus. Kui need on olemas, aga lugeja nende otsa ei komista, siis on kõik suurepärane.

Nüüd jääb üle välja mõelda, milline märksõna kasutamise sagedus dokumendis on optimaalne, mis võimaldab muuta lehe võimalikult asjakohaseks ega too kaasa sanktsioone. Meenutagem esmalt valemit, mida enamik (ilmselt isegi kõik) otsingumootorid järjestamiseks kasutavad.

Kuidas määrata võtme kasutamise lubatud sagedust

Matemaatilisest mudelist oleme juba eespool mainitud artiklis rääkinud. Selle konkreetse otsingupäringu olemust väljendab üks lihtsustatud valem: TF*IDF. Kus TF on selle päringu otsene esinemissagedus dokumendi tekstis (sõnade esinemissagedus selles).

IDF on antud päringu pöördsagedus (haruldus) kõigis teistes antud otsingumootori (kogus) indekseeritud Interneti-dokumentides.

See valem võimaldab teil määrata dokumendi vastavust (asjakohasust) otsingupäringule. Mida kõrgem on toote TF*IDF väärtus, seda asjakohasem on dokument ja seda kõrgem on see, kui kõik muud asjad on võrdsed.

Need. selgub, et dokumendi kaal antud päringu puhul (selle vastavus) on suurem, mida sagedamini selle päringu võtmeid tekstis kasutatakse ja seda harvemini leidub neid võtmeid teistes Interneti-dokumentides.

On selge, et me ei saa IDF-i mõjutada, välja arvatud juhul, kui valime mõne muu taotluse, mille jaoks optimeerime. Kuid me saame ja hakkame TF-i mõjutama, sest tahame saada oma osa (ja mitte väikese) Yandexi ja Google'i otsingutulemuste liiklusest vajalike kasutajate küsimuste kohta.

Kuid tõsiasi on see, et otsingualgoritmid arvutavad TF väärtuse üsna kavala valemi abil, mis arvestab märksõna kasutamise sageduse suurenemist tekstis vaid teatud piirini, mille järel TF kasv praktiliselt peatub, vaatamata tõsiasi, et suurendate sagedust. See on omamoodi rämpspostifilter.

Suhteliselt kaua aega tagasi (umbes aastani 2005) arvutati TF väärtus üsna lihtsa valemi abil ja see oli tegelikult võrdne märksõna esinemissagedusega. Selle valemi abil asjakohasuse arvutamise tulemused ei meeldinud otsingumootoritele täielikult, sest need panid rämpsposti saatjatele.

Siis muutus TF valem keerulisemaks, tekkis selline mõiste nagu lehepaha ja see hakkas sõltuma mitte ainult esinemissagedusest, vaid ka teiste sõnade kasutamise sagedusest samas tekstis. Ja optimaalse TF väärtuse saaks saavutada, kui võti osutuks kõige sagedamini kasutatavaks sõnaks.

Samuti oli võimalik TF väärtust suurendada, suurendades teksti suurust, säilitades samal ajal esinemisprotsendi. Mida suurem on rätik sama võtmete protsendiga artikliga, seda kõrgem on dokument.

Nüüd on TF valem muutunud veelgi keerulisemaks, kuid samas ei pea me tihedust väärtuseni viima, kui tekst muutub loetamatuks ja otsingumootorid kehtestavad keelake meie projekt rämpsposti tõttu. Ja ka praegu pole vaja ebaproportsionaalselt pikki lehti kirjutada.

Säilitades sama ideaalse tiheduse (määrame selle täpselt allpool vastava graafiku järgi), parandab artikli suuruse suurendamine sõnades selle positsiooni otsingutulemustes vaid teatud pikkuseni. Kui teil on ideaalne pikkus, ei mõjuta selle edasine suurendamine asjakohasust (täpsemalt küll, kuid väga-väga vähe).

Kõik see on selgelt näha, kui koostate selle keerulise TF-i (otse esinemissageduse) põhjal graafiku. Kui selle graafiku ühel skaalal on TF ja teisel skaalal on märksõna tekstis esinemissageduse protsentuaalne suhe, siis saame tulemuseks nn hüperbooli:

Graafik on muidugi ligikaudne, sest vähesed teavad tegelikku TF-i valemit, mida Yandex või Google kasutavad. Kuid kvalitatiivselt saab seda määrata optimaalne vahemik, milles sagedus peaks asuma. See on ligikaudu 2-3 protsenti sõnade koguarvust.

Kui arvate, et lisate osa võtmeid ka rõhumärkidesse ja päisesse TITLE, siis on see piir, mille järel võib tiheduse edasine suurendamine olla seotud keeluga. Enam pole tulus teksti küllastada ja moonutada suure hulga märksõnadega, sest miinuseid on rohkem kui plusse.

Kui pikast tekstist piisab edutamiseks?

Sama oletatava TF põhjal saab joonistada selle väärtuse ja pikkuse sõnades. Sel juhul võite võtta märksõnade sageduse konstantseks mis tahes pikkusega ja võrdne näiteks mis tahes väärtusega optimaalsest vahemikust (2–3 protsenti).

Tähelepanuväärne on see, et saame täpselt sama kujuga graafiku, nagu eespool käsitletud, piki x-telge reguleeritakse ainult teksti pikkust tuhandetes sõnades. Ja selle põhjal on võimalik teha järeldus optimaalne pikkusvahemik, mille juures on peaaegu maksimaalne TF väärtus juba saavutatud.

Selle tulemusena selgub, et see jääb vahemikku 1000–2000 sõna. Edasise suurenemise korral asjakohasus praktiliselt ei suurene ja lühema pikkusega langeb see üsna järsult.

See. Võime järeldada, et selleks, et teie artiklid otsingutulemustes kõrgele kohale jõuaksid, peate tekstis kasutama märksõnu sagedusega vähemalt 2-3%. See on esimene ja peamine järeldus, mille me tegime. Noh, teine ​​asi on see, et nüüd pole üldse vaja tippu jõudmiseks kirjutada väga mahukaid artikleid.

Piisab, kui ületate 1000–2000 sõna läve ja lisate sellesse 2–3% märksõnadest. See on kõik - see on kõik täiusliku teksti retsept, mis suudab konkureerida madala sagedusega päringute edetabelis isegi ilma välist optimeerimist kasutamata (ostes selle artikli linke koos võtmeid sisaldavate ankrutega). Kuigi, tuhnige natuke Miralinkse , GGL, Rotapost või GetGoodLink, saate, sest see aitab teie projekti.

Tuletan teile veel kord meelde, et saate teada nii kirjutatud teksti pikkuse kui ka selles teatud märksõnade kasutamise sageduse, spetsiaalsete programmide või nende analüüsile spetsialiseerunud võrguteenuste kasutamise. Üks neist teenustest on ISTIO, tööst, kellega ma rääkisin.

Kõik, mida ma eespool ütlesin, ei ole sada protsenti usaldusväärne, vaid väga sarnane tõega. Igal juhul minu isiklik kogemus kinnitab seda teooriat. Kuid Yandexi ja Google'i algoritmid muutuvad pidevalt ja vähesed inimesed teavad, kuidas see homme on, välja arvatud need, kes on nende arenduse või arendajate lähedal.

Edu sulle! Kohtumiseni ajaveebisaidi lehtedel

Võib-olla olete huvitatud

Sisemine optimeerimine - märksõna valik, iivelduse kontroll, optimaalne pealkiri, sisu dubleerimine ja linkimine LF-i all
Märksõnad tekstis ja pealkirjades
Kuidas märksõnad mõjutavad veebisaidi reklaamimist otsingumootorites
Veebiteenused veebimeistritele – kõik, mida vajate artiklite kirjutamiseks, otsingumootoritele optimeerimiseks ja selle edu analüüsimiseks
Meetodid sisu optimeerimiseks ja saidi teema arvestamiseks lingi reklaamimise ajal kulude minimeerimiseks
Yandex Wordstat ja semantiline tuum - veebisaidi märksõnade valik veebiteenuse Wordstat.Yandex.ru statistika abil
Ankur – mis see on ja kui olulised on need veebisaidi reklaamimisel?
Millised otsingumootori optimeerimise tegurid mõjutavad veebisaidi reklaamimist ja mil määral?
Saidi ise reklaamimine, reklaamimine ja optimeerimine
Võttes arvesse keele morfoloogiat ja muid otsingumootorite lahendatavaid probleeme, samuti erinevusi kõrgsageduslike, keskmiste ja madala sagedusega päringute vahel
Saidi usaldus – mis see on, kuidas seda XToolsis mõõta, mis seda mõjutab ja kuidas oma saidi autoriteeti tõsta

Sõnastik sisaldab tänapäeva vene keele levinumaid sõnu (20. sajandi 2. pool – 21. sajandi algus), mis on varustatud teabega kasutussageduse, statistilise jaotuse teksti ja žanri järgi ning tekstide loomise aja kohta. . Sõnastik põhineb 100 miljoni sõna mahuga vene keele rahvuskorpuse tekstidel. Lisateavet vene keele sagedussõnastike ajaloo ja sõnastiku “Uus vene keele sõnavara sagedussõnastiku” loomise meetodite kohta saab lugeda.

Sõnastiku kontseptsiooni töötasid välja ja valmistasid avaldamiseks ette O. N. Ljaševskaja ja S. A. Šarov, elektroonilise versiooni koostas A. V. Sannikov. Autorid avaldavad tänu V. A. Plungjanile, A. Ya. Šaikevitšile, E. A. Grišinale, B. P. Kobritsovile, E. V. Rakhilinale, S. O. Savtšukile, D. V. Sichinavale ja teistele NCRY seminaril osalejatele, kes võtsid osa sõnastiku loomise põhimõtete arutelust. . Täname O. Uryupinat, D. ja G. Bronnikovsit, B. Kobritsovit, samuti Yandex LLC töötajaid A. Abroskinit, N. Grigorjevit, A. Sokirkot abi eest materjalide kogumise ja arvutitöötluse erinevatel etappidel.

Kuidas sõnaraamatust sõna leida?

Sõnastiku kaks peamist osa on sõnade loend, mis on järjestatud tähestikulises järjekorras ja üldise kasutussageduse järgi korpuses. Kõik sõnad on antud nende algsel (algulisel) kujul: nimede puhul on see nimetav käändevorm (nimisõnade puhul reeglina ainsuse vorm, omadussõnade puhul - täismeessoost vorm), tegusõnade puhul - infinitiivivorm.

Tähestikuline loend sisaldab 60 tuhat kõige sagedamini esinevat sõnavormi. Soovitud sõna kohta teabe leidmiseks minge jaotisse, valige sõna esimene täht ja leidke tabelist otsitav sõna. Sõna kiireks leidmiseks võite kasutada ka otsingukasti, näiteks:

Sõna: suurepärane

Nii saate leida teavet mitte ainult konkreetse sõna, vaid ka sõnade rühma kohta, mis algavad või lõppevad samal viisil. Selleks kasutage otsinguaknas tärni (*) pärast trükitud tähejada (“kõik sõnad, mis algavad...”) või enne tähejada (“kõik sõnad, mis lõpevad...”. Näiteks kui soovite leida kõiki sõnu, mis algavad tähega uuesti, tippige otsingukasti:

Sõna: re*

Kui soovite leida kõik sõnad, mis lõpevad - ainult natuke, tippige otsingukasti:

Sõna: *ei

Lemmade sagedusloendis on sõnad järjestatud tänapäeva vene kirjakeele korpuse üldise kasutussageduse järgi. Sagedusnimekirjas on 20 000 enamkasutatavat lemmat.

Soovitud sõna kohta teabe leidmiseks minge jaotisse ja leidke tabelist soovitud sõna. Üksikute sõnade kohta teabe otsimiseks on kõige parem kasutada sõna kiirotsingu akent.

Miks ma ei leia sõna sõnastikust, kuigi leian selle korpusest?

See võib olla tingitud mitmest põhjusest. Esiteks võib sõna olla madala sagedusega (näiteks korpuses ainult 3 esinemissagedust) või seda kasutada ainult enne 1950. aastat kirjutatud tekstides. Teiseks võib sõna esineda mitu korda, aga ühes või kahes tekstis: sellised lemmad jäeti sõnastikust teadlikult välja. Kolmandaks ei saa välistada, et sõna algvormi või kõneosa tunnuste automaatsel määramisel tekkis viga või et sõna omistati ekslikult pärisnimisõnaks. Saidil on sagedussõnastiku "test" versioon ja me jätkame tööd selle leksikaalse koostise selgitamiseks.

Millist teavet saate sõna kasutamise kohta?

Sõnastikust saad järgmist infot sõna kasutamise kohta korpuses:

  • lemma kasutuste koguarv (kogusagedus ipm ühikutes), vt jaotisi, ilukirjanduse sagedussõnastikke ja muid funktsionaalseid stiile; nimisõnade, tegusõnade ja muude kõneosade sagedussõnastikud
  • sõna sagedusaste (st järjekorranumber üldises sagedusloendis), vt nimisõnade, tegusõnade ja muude kõneosade jaotisi, sagedussõnastikke.
  • tekstide arv, milles sõna esines (dokumentide arv), vt jaotist;
  • variatsioonikoefitsient D, vt nimisõnade, tegusõnade ja muude kõneosade jaotisi ja sagedussõnastikke
  • sõnakasutuse jaotus erinevatel aastakümnetel (1950., 1960. aastad jne) loodud tekstides, vt ptk;
  • üksikute sõnavormide üldine kasutussagedus, vt osa Sõnavormide tähestikuline loetelu.

    Sisulise sõnavara sõnaraamatutest saab teavet ka sõna võrdlussageduse kohta üldkorpuses ja teatud funktsionaalse stiili tekstide (ilukirjandus, ajakirjandus jne) alamkorpuses ning LL-skoori tõenäosusnäitaja.

    Lisaks kvantitatiivsetele näitajatele näidatakse sõna kõneosa. Seda tehakse selleks, et eraldada sõnad erinevatest kõneosadest, millel on sama algkuju (vt. küpseta - nimisõna ja tegusõna).

    Mis on ipm?

    Üldine sagedus iseloomustab esinemiste arvu korpuse miljoni sõna kohta ehk ipm (esinemisi miljoni sõna kohta). Tegemist on maailmapraktikas üldtunnustatud sageduse mõõtühikuga, mis lihtsustab sõnade sageduse võrdlemist erinevates sagedussõnastikes ja erinevates korpustes. Fakt on see, et tekstinäidised, mille põhjal sagedust mõõdetakse, võivad oma suuruse poolest üsna erineda. Näiteks kui sõna võimsus esineb 55 korda 400 tuhande sõnaga korpuses, 364 korda miljonites ja 40 598 korda 100 miljonist sõnast koosnevas kaasaegse vene keele korpuses ning 55 673 korda suures 135 miljonilises NKRY korpuses, siis selle sagedus ipm-des. on vastavalt 137,5, 364,0, 372,06 ja 412,39.

    Sagedussõnastikud, toim. L.N. Zasorina ja L. Lenngren olid üles ehitatud vastavalt ühe miljoni sõnakasutuse valimile, võib eeldada, et seal esinevad absoluutnäitajad on antud ka ipm-s.

    Mis on variatsioonikordaja D?

    A. Juillandi poolt kasutusele võetud koefitsient D (Juilland et al. 1970) on kasutusel paljudes sagedussõnastikes (L. Lenngreni vene sõnaraamat, Briti rahvuskorpuse sõnaraamat, ärivaldkonna prantsuse keele sõnavara sõnastik). See koefitsient võimaldab näha, kui ühtlaselt on sõna erinevates tekstides jaotunud.

    Koefitsiendi väärtus määratakse vahemikus 0 kuni 100. Näiteks sõna Ja leidub peaaegu kõigis korpuse tekstides ja selle D väärtus on ligi 100. Sõna komissurotoomia esineb korpuses 5 korda, kuid ainult ühes tekstis; selle D väärtus on umbes 0.

    Iga sõna koefitsiendi D määramine võimaldab hinnata, kui spetsiifiline see on konkreetsetele ainevaldkondadele. Näiteks sõnad üleküpsenud Ja implantaat on ligikaudu sama sagedusega (0,56 ipm), kuid samal ajal on koefitsient D üleküpsenud võrdub 90, a implantaadi juures - 0. See tähendab, et esimene sõna esineb erineva suunaga tekstides ühtlaselt ja on oluline paljude ainevaldkondade jaoks, samas kui sõna implantaat esineb vaid mõnes tekstis teemal "meditsiin ja tervis".

    Mida saate teada selle sõna kasutamise ajaloost erinevatel perioodidel?

    Teavet sõnasageduse leviku kohta 20. sajandi 2. poole ja 21. sajandi alguse erinevatel aastakümnetel saab aastal. Näiteks on näha, kuidas sõna saatus kujunes perestroika:

    Selle kasutamise järsk tõus 1980. aastatel on üsna seletatav tolleaegse sotsiaalajaloolise reaalsusega; samas saab seda fakti keelelisest aspektist tõlgendada nii: sõna perestroika rikastatud uue tähendusega, mis sai järgnevatel aastatel domineerivaks.

    Miks on pärisnimed ja lühendid eraldi nimekirjas?

    Omasõnad on sõnaraamatu põhiosast eraldatud, kuna need moodustavad statistiliselt palju vähem stabiilse rühma ning nende esinemissagedus sõltub suuresti korpuses olevate tekstide valikust ja teemast (eelkõige kohast ja ajast). kirjeldatud sündmused). Lenngren 1993 avaldas arvamust, et pärisnimede üldine sagedussõnaraamatusse lisamine toob paratamatult kaasa selle enneaegse vananemise.

    Sõnastik sisaldab selle loendi tuumaosa, numereerides 3000 kõige sagedamini esinevat ühikut. Eesnimede, isanimede, perekonnanimede, hüüdnimede, hüüdnimede, toponüümide, organisatsioonide nimede ja lühendite kasutamise kohta andmete otsimiseks minge jaotisse Pärisnimede ja lühendite tähestikuline loend, valige täht, millega otsitav sõna jaoks ja leidke see tabelist. Võite kasutada ka sõna kiirotsingu akent.

    Kuidas saada teavet sõna üksikute vormide kasutamise kohta?

    Lisaks teabele lemma (ehk sõna kõigis käändevormides) kasutamise kohta saate sõnastikust teada, kuidas üksikuid sõnavorme kasutatakse. Minge jaotisse Sõnavormide tähestikuline loend, valige täht, millega sõnavorm algab, ja leidke see tabelist. Võite kasutada ka kiirotsingu akent, näiteks:

    Sõnavorm: lennata

    Kõigi sõnavormide leidmiseks, mis algavad (või lõpevad) kindla tähejadaga, kasutage otsingukastis tärni (*). Näiteks kõik sõnavormid, mis algavad tähega eutanaasia -, leiate, tippides:

    Sõnavorm: maga*

    Kõik sõnavormid, mis lõpevad ¬-ga -ic, leiate, tippides:

    Sõnavorm: *luksumine

    Sõnavormide tähestikuline loend sisaldab kõiki korpuse sõnavorme sagedusega üle 0,1 ipm (kokku umbes 15 tuhat) ja sisaldab teavet nende üldise esinemissageduse kohta. Homonüümsed sõnavormid on tabelis tähistatud tähega *.

    Kuidas leida teavet "kõige levinumate" sõnade kohta?

    Meie sõnastikku kasutades leiate teavet sõnaklasside kohta, mis erinevad üldiste statistiliste omaduste poolest. Need on eelkõige:

  • sagedasemad sõnad korpusest üldvalimis; üldvalimi keskmise sagedusega sõnad jne. (vt jaotist);
  • ilukirjanduse alamkorpuses kõige sagedamini esinevad sõnad (vt jaotist Ilukirjanduse sagedussõnastik);
  • ajakirjanduse alamkorpuses kõige sagedamini esinevad sõnad (vt rubriiki ajakirjanduse sagedussõnastik);
  • sõnad, mis esinevad kõige sagedamini muu aimekirjanduse alamkorpuses (vt jaotist Muu aimekirjanduse sagedussõnastik);
  • sõnad, mis on suulisele kõnele kõige iseloomulikumad (vt jaotist Elava suulise kõne sagedussõnastik).
  • sagedasemad nimisõnad (vt jaotist Nimisõnade sagedusloend);
  • sagedasemad verbid (vt osa Tegusõnade sagedusloend);

    ja muud osaliste kõnetundide sagedusloendid.

    Lisaks pakutud klassidele saate iseseisvalt uurida teisi sõnarühmi, kasutades tabelit "Üldine tähestikuline loend" jaotises Sõnavormide tähestikuline loend (näiteks saate uurida eesliitega kõige sagedamini esinevaid tegusõnu uuesti, rohkem kui 200 tekstist leitud sõnu ja palju muud: klasside rühmitamise põhimõtted sõltuvad teie ülesannetest ja teie kujutlusvõimest).

    Kuidas jälgida sagedusjaotust erineva funktsionaalse stiiliga tekstides?

    L.N. Zasorina sagedussõnastik annab andmeid sõnakasutuse kohta nelja tüüpi tekstides: (I) ajalehtede ja ajakirjade tekstid, (II) draama, (III) teadus- ja ajakirjandustekstid, (IV) kunstiline proosa. Meie sõnastikust saate sarnast teavet, kasutades jaotist "Lemmade jaotus funktsionaalsete stiilide järgi".

    Funktsionaalsete stiilide sagedussõnastikud koostatakse ilukirjanduse, ajakirjanduse, muu aimekirjanduse ja suulise elava kõne alamkorpuste põhjal. Võrreldes L. N. Zasorina sõnaraamatuga on pealkirjade koostist veidi muudetud: dramaturgia asemel kasutatakse elava suulise kõne salvestusi ja filmi heliribade transkriptsioone, teaduskirjandus on eraldatud eraldi sektsioonis koos ametiasjade, kiriku ja muu mitteilukirjandus.

    Nimekirjas on nende alamkorpuste 5000 sagedasemat lemmat. Iga lemma puhul on märgitud kõneosa, sagedus alamkorpuses ja koefitsient D.

    Mis on tähendusliku sõnavara (ilukirjanduse jne) sõnastik?

    On sõnu, mida ühes funktsionaalses stiilis kasutatakse palju sagedamini kui teistes. Näiteks elava suulise kõne puhul on sellised sõnad siin üldiselt Ja OKEI. Tõepoolest, on raske ette kujutada, et teadus- ja tehnikakirjanduses kasutatakse neid sõnu sama sageli kui igapäevakeeles.

    Tuginedes lemmade esinemissageduse võrdlusele antud tekstide alamkorpuses ja ülejäänud korpuses, selgitati välja iga funktsionaalse tekstitüübi tüüpilisemate lemmade loend. Märkimisväärse sõnavara sõnastikud sisaldavad 500 lemmat.

    Mida tähendavad tähendusliku sõnavara sõnastikus näitajad frq1, frq2 ja LL-skoor?

    Frq1 on lemma üldine sagedus kogu korpuses (ipm ühikutes), frq2 on lemma sagedus antud alamkorpuses (ilukirjanduse, ajakirjanduse, muu mitteilukirjanduse ja elava kõnekeele alamkorpus, vastavalt), LL-skoor on tõenäosussuhe, mis arvutatakse frq1 ja frq2 põhjal P. Raysoni ja A. Garside'i pakutud valemi järgi (vt selle kohta lähemalt sõnastiku sissejuhatusest). Mida kõrgem on LL-skoor, seda olulisem on sõna antud funktsionaalse stiili jaoks.

    Kuidas saada nimekirja 100 kõige sagedamini esinevast tegusõnast?

    Jaotises “Üldsõnavara: kõneosad” on lemmade sagedusloend jagatud seitsmeks alamloendiks: nimisõnad, tegusõnad, omadussõnad, määrsõnad ja predikaadid, asesõnad, arvsõnad ja kõne abiosad. Siin on iga lemma puhul märgitud selle üldine sagedus ja auaste (järjekorranumber) üldnimekirjas. Igas loendis on 1000 kõige sagedamini esinevat lemmat.

    Seega saate loendi 100 kõige sagedamini esinevast verbist, kui lähete alamjaotisesse Sagedusverbide loend ja valite loendi ülaosas esimesed 100 verbi. Samamoodi saate teada, milline omadussõna on kõige sagedasem (nagu on öeldud jaotises Omadussõnade sagedusloend, see omadussõna uus) ja saate teada palju muid huvitavaid fakte osakõne tundide koosseisu kohta.

    Kuidas kasutada abitabeleid?

    Abitabelid sisaldavad esiteks andmeid alamkõnetundide esinemissageduse kohta, aga ka muid grammatilisi kategooriaid. Need andmed saadi NKRY alamkorpuse põhjal, mille leksikaalne ja grammatiline mitmetähenduslikkus on eemaldatud (käsitsi) (suurus üle 6 miljoni sõnakasutuse). Kuna statistika hõlmab suuri sõnaklasse, on alust arvata, et kõneosade ja muude grammatiliste kategooriate osakaal on kogu korpuses sama.

    Teiseks annab see jaotis teavet lekseemide tekstikatvuse, sõna keskmise pikkuse, sõnavormi ja lause kohta.

    Kolmandaks on siin vene tähestiku tähtede, kirjavahemärkide ning kahe- ja mitmetäheliste kombinatsioonide kasutamise sagedusloendid.