Käyttötiheys. Mitä indikaattorit frq1, frq2 ja LL-pisteet tarkoittavat merkityksellisen sanaston sanakirjassa

Käyttötiheys

substantiivi, synonyymien määrä: 1

käyttö (10)

- Sanasto, jonka käyttöä rajoitetaan tietyistä syistä. extralingvistiset syyt. To L.o.u. sisältää: murteet, termit ja ammattimaisuus, ammattikieltä, puhekielen sanat ja ilmaisut, vulgarismit...
Sosiolingvististen termien sanakirja
Yleinen kielitiede. Sosiolingvistiikka: Sanakirja-viitekirja
- käännös saksankielisestä termistä Gebrauchstypen, jonka Delbrück otti käyttöön osoittamaan kieliopin muotojen vakiintuneita käyttötapoja. T:lle ylös. sisältää esimerkiksi erilaisia syntaktisia käyttömuotoja...
Brockhausin ja Euphronin tietosanakirja
- Sanasto, jonka käyttöä rajoittavat ekstralingvistiset syyt: 1) alueellisesti rajoitetut dialektiikat; 2) tieteellisessä tyylissä käytetyt termit...
Kielellisten termien sanakirja T.V. Varsa
Kielellisten termien sanakirja T.V. Varsa
- Käyttö, joka kieltää esineiden välisten erojen käytön: Eläviä organismeja ei voi olla ilman...
- Käyttö, joka korreloi tietyn objektiluokan tiettyjen edustajien kanssa: Minun täytyy nähdä tämä henkilö...
Yleisen morfologian termit ja käsitteet: Sanakirja-viitekirja
- 1) Sääntöjen mukaiset vaihtoehdot monimutkaisten epäyhtenäisten lauseiden muotoilulle: selityksessä tai motivoinnissa voidaan käyttää kaksoispisteen sijasta väliviivaa: Erottaminen on illusorista - olemme pian yhdessä...
Syntaksi: Sanakirja
- adverbi, synonyymien määrä: 1 piilotettu...
Synonyymien sanakirja
- adj., synonyymien lukumäärä: 10 julkaistu, vanhentunut, ei täytä nykyajan vaatimuksia, vanhentunut, vanhentunut, jäänyt legendan valtakuntaan...
Synonyymien sanakirja
-cm...
Synonyymien sanakirja
- adj., synonyymien määrä: 19 anakronistinen arkaainen arkaainen vanhentunut vanhentunut vanhentunut vanhentunut vanhentunut vanhentunut vanhentunut eläkkeellä alueelle...
Synonyymien sanakirja
- adj., synonyymien lukumäärä: 2 ei sovellu käytettäväksi harvinainen...
Synonyymien sanakirja
- adj., synonyymien lukumäärä: 3 jäänyt käyttämättä laittaa sivuun laittaa kannen alle...
Synonyymien sanakirja
- 1) Sääntöjen tarjoamat vaihtoehdot monimutkaisten ei-yhdistyslauseiden muotoiluun: selityksessä tai motivoinnissa voidaan käyttää kaksoispisteen sijasta väliviivaa: Erotus on illusorista - olemme pian yhdessä 2) Eristämisellä...
Kielellisten termien sanakirja T.V. Varsa

"käyttötiheys" kirjoissa

Ruokintatiheys

Kirjailija: Harmar Hillery

Ruokintatiheys

Kirjailija: Harmar Hillery

Ruokintatiheys Pennun tarvittava ruokintakertojen määrä päivässä riippuu rodun koosta. Useimmat pennut viihtyvät, kun niitä ruokitaan kolmen tunnin välein päivällä ja yöllä, mutta jos ne ovat syntyneet ennenaikaisesti tai painoivat alle 85 g syntyessään, ne todennäköisesti ovat

Ruokintatiheys

Kirjasta Breeding Dogs Kirjailija: Harmar Hillery

Ruokintatiheys

Kirjasta Koirat ja niiden jalostus [Koirankasvatus] Kirjailija: Harmar Hillery

Taajuus

Kirjasta Real Estate. Kuinka mainostaa sitä kirjoittaja Nazaikin Aleksanteri

14.2.3. Vuorovaikutustaajuus

Kirjailija: Dimitri Nicola

14.2.3. Vuorovaikutusten tiheys Mitä useammin sama kilpailijaryhmä on vuorovaikutuksessa, sitä kestävämpi yhteistyö on, koska rikkomuksista rangaistaan nopeammin. Jos esimerkiksi yritykset kilpailevat harvemmin, niiden kyky ylläpitää yhteistoimintaa on heikompi.

15.4.6. Huutokauppatiheys

Kirjasta Ostoopas Kirjailija: Dimitri Nicola

15.4.6. Huutokauppojen tiheys Kuten edellä mainittiin, jotkin huutokaupparenkaat voivat siirtää varoja keskenään huutokaupan jälkeen, josta ne ovat sopineet, tai ne voivat pitää kirjaa maksettavista summista vain satunnaisesti.

8. Toimintosanojen käyttötiheys osoittautuu tekijän invariantiksi

Kirjasta Kirja 2. Muutamme päivämääriä - kaikki muuttuu. [Kreikan ja Raamatun uusi kronologia. Matematiikka paljastaa keskiaikaisten kronologien petoksen] kirjoittaja Fomenko Anatoli Timofejevitš

8. Toimintosanojen käyttötiheys osoittautuu tekijän invariantiksi Merkittävä poikkeus on meidän parametrimme 3 - kaikkien funktiosanojen käyttötiheys - PRESSIT, KONJUNKTIOT JA PARTIKKELIT. Tämän parametrin kehitys näytteen koon kasvusta riippuen esitetään

Taajuus

Kirjailijan kirjasta Great Soviet Encyclopedia (CA). TSB

Taajuus

kirjoittaja Nazaikin Aleksanteri

Taajuus

Kirjasta Median suunnittelu 100:lle kirjoittaja Nazaikin Aleksanteri

Taajuus Televisiokanavat lähetetään metri- ja desimetritaajuuksilla. Mittarialueet hallittiin ensimmäisenä televisiossa. 1900-luvun 90-luvulla desimetrikanavat alkoivat toimia aktiivisesti Moskovassa. Aikaisemmin taajuudella oli suuri merkitys, koska eri kanavien vastaanottamisessa

Taajuus

Kirjasta Median suunnittelu 100:lle kirjoittaja Nazaikin Aleksanteri

Taajuus Signaalin lähetyksen taajuus määrää sen laadun. Suuremmassa määrin se tarjotaan VHF-kaistoilla (taajuusmodulaatio FM). Kuuntelijat suosivat hyvää ääntä, minkä vuoksi VHF-asemilla on merkittävät yleisöluokitukset ja niitä suositaan

3.2. Taajuus

kirjoittaja Ivanov Dmitri Olegovitš

3.2. Taajuus Kun puhutaan minkä tahansa patologian merkityksestä lääketieteessä, on mielestämme tärkeää puhua tapahtuneiden tai mahdollisesti ilmenevien vammojen ja komplikaatioiden etiologian, patogeneesin, kliinisen kuvan ja vammojen lisäksi myös vammojen ja komplikaatioiden vakavuudesta. tämän patologian esiintyvyys. TO

4.2. Taajuus

Kirjasta Lämpötasapainohäiriöt vastasyntyneillä kirjoittaja Ivanov Dmitri Olegovitš

4.2. Taajuus Hypertermia vastasyntyneillä on luultavasti paljon harvinaisempaa kuin hypotermia. Tämä johtuu todennäköisesti siitä, että tieteellisessä kirjallisuudessa on erittäin vähän tutkimuksia imeväisten hypertermiasta. Maayan-Metzger A. et ai. (2003) analysoi 42 313 tapausraporttia

Taajuus

Kirjasta Glucose Metabolism Disorders in Newborns kirjoittaja Ivanov Dmitri Olegovitš

Frequency Corblant M., joka määritteli hypoglykemian verensokeripitoisuudeksi, joka oli alle 30 mg% (1,67 mmol/l) ensimmäisten 72 tunnin aikana, havaitsi sen 4,4 prosentissa kaikista elävänä syntyneistä. Vuonna 1971 Lubchenco L. O. ja Bard N., käyttäen Corblant M. -kriteerejä, tunnisti hypoglykemian vastasyntyneillä, joilla oli suurempi

Kirjoitin hauskan PHP-skriptin. Ajoin kaikki Spectatorin tekstit sen läpi tarkistaakseni kielen. Kaikkiaan teksteissä käytetään 39 110 eri sanamuotoa. Kuinka monta erilaista tarkalleen? sanat- melko vaikea määrittää. Päästäkseni ainakin jotenkin lähemmäksi tätä lukua, otin vain sanan 5 ensimmäistä kirjainta ja vertasin niitä. Tuloksena oli 14 373 tällaista yhdistelmää. Olisi venyvää kutsua tätä "katsojien" sanastoksi.

Sitten otin sanat ja tutkin niistä kirjainten toistotiheyttä. Ihannetapauksessa sinun on otettava jonkinlainen sanakirja kuvan täydentämiseksi. Et voi ajaa tekstejä, tarvitset vain ainutlaatuisia sanoja. Tekstissä jotkut sanat toistuvat useammin kuin toiset. Joten saatiin seuraavat tulokset:

o - 9,28 %
a - 8,66 %
e - 8,10 %
ja -7,45 %
n - 6,35 %
t - 6,30 %
p - 5,53 %
s - 5,45 %
l - 4,32 %
sisään - 4,19 %
k - 3,47 %
n - 3,35 %
m - 3,29 %
v - 2,90 %
d - 2,56 %
I - 2,22 %
s - 2,11 %
b - 1,90 %
z - 1,81 %
b - 1,51 %
g - 1,41 %
th - 1,31 %
h - 1,27 %
yu - 1,03 %
x - 0,92 %
f - 0,78 %
paino - 0,77 %
c - 0,52 %
sch - 0,49 %
f - 0,40 %
e - 0,17 %
ъ - 0,04 %

Suosittelen "Ihmeiden kentälle" meneviä opettelemaan ulkoa tämä taulukko. Ja nimeä sanat tässä järjestyksessä. Joten esimerkiksi näyttää siltä, että tällaista "tuttua" kirjainta "b" käytetään harvemmin kuin "harvinaista" kirjainta "s". Meidän on myös muistettava, että sanassa on enemmän kuin yksi vokaali. Ja että jos arvasit yhden vokaalin, sinun on alettava seurata konsonantteja. Ja lisäksi sana arvataan tarkasti sen konsonanttien perusteella. Vertaa: "**a**i*e" ja "sr*vn*t*". Molemmissa tapauksissa sana on "vertaa".

Ja vielä yksi huomio. Kuinka opit englantia? Muistaa? E kynä, e lyijykynä, e pöytä. Se mitä näen, on se, mistä laulan. Mitä järkeä?.. Kuinka usein sanot sanan "lyijykynä" normaalielämässä? Jos tehtävänä on opettaa puhumaan mahdollisimman nopeasti ja tehokkaasti, sinun on opetettava vastaavasti. Analysoimme kieltä ja korostamme yleisimmin käytetyt sanat. Ja alamme oppia heiltä. Enemmän tai vähemmän puhua englantia, vain puolitoista tuhatta sanaa riittää.

Toinen hemmottelua: muodostaa sanoja kirjaimista satunnaisesti, mutta ottaen huomioon esiintymistiheys, jotta se näyttää normaaleista sanoista. Ensimmäisessä kymmenessä "satunnaisessa" nelikirjaimassa sanassa "aasi" ilmestyi. Seuraavassa viidessäkymmenessä - sanat "ryntää" ja "NATO". Mutta valitettavasti on olemassa monia dissonanttisia yhdistelmiä, kuten "bltt" tai "nrro".

Siksi - seuraava askel. Jaoin kaikki sanat kahden kirjaimen yhdistelmiin ja aloin yhdistää niitä satunnaisesti (mutta ottaen huomioon toistotiheyden). Suurissa määrissä teräs tuottaa sanoja, jotka ovat samankaltaisia kuin "normaali". Esimerkiksi: "koivdiot", "voabma", "apy", "depoid", "debyako", "orfa", "poesnavy", "ozza", "chenya", "retoria", "urdeed", "utoichi" , "stikh", "sapot", "gravda", "ababap", "obarto", "eleuet", "lyarezy", "myni", "bromomer" ja jopa "todebyst".

Mihin hakea... vaihtoehtoja on. Kirjoita esimerkiksi kauniiden merkkituotteiden, leikkisä nimien generaattori. Jogurteille. Kuten "memoliso" tai "utororerto". Tai - futurististen runojen generaattori "Burliuk-php": "opeldiy miaton, linoaz okmiaya... deesopen odesson."

Ja on vielä yksi vaihtoehto. Pitää kokeilla...

Jotkut tilastot venäjän sanojen käytöstä:

Sanan keskimääräinen pituus on 5,28 merkkiä.
Keskimääräinen lauseen pituus on 10,38 sanaa.
1000 yleisintä lemmaa kattavat 64,0708 % tekstistä.
Vuoden 2000 yleisimmät lemmat kattavat 71,9521 % tekstistä.
3000 yleisintä lemmaa kattavat 76,5104 % tekstistä.
5000 yleisintä lemmaa kattavat 82,0604 % tekstistä.

Muistiinpanon jälkeen sain tämän kirjeen:

Hei Dmitry!
Analysoituaan artikkelin ”Kieli vie sinut Kiovaan” ja sen osan, jossa kuvailet ohjelmaasi, syntyi idea.
Kirjoittamasi käsikirjoitus näyttää minusta olevan tarkoitettu ehdottomasti ei "Ihmeiden kentälle" suuremmassa määrin, vaan johonkin muuhun.
Ensimmäinen järkevin käyttö skriptisi tulosten avulla on kirjainten järjestyksen määrittäminen mobiililaitteiden painikkeiden ohjelmoinnissa. Kyllä, kyllä - kaikkea tätä tarvitaan matkapuhelimissa.
Jaoin sen aaltoina ()
Seuraava on jakauma painikkeilla:
1. Kaikki ensimmäisen aallon kirjaimet siirtyvät 4 painikkeeseen ensimmäisellä rivillä
2. Kaikki toisen aallon kirjaimet ovat myös saman ensimmäisen rivin lopuilla 4 painikkeella
3. Kaikki kolmannen aallon kirjaimet menevät kahdelle jäljellä olevalle painikkeelle
4. 4,5 ja 6 aaltoa menevät toiselle riville
5. 7,8,9 aaltoa menee kolmannelle riville ja 9. aalto menee kokonaan (huolimatta näennäisen suuresta kirjainten määrästä) 9. painikkeen kolmanteen riviin, joten 10. painike jää kaikenlaisille välimerkeille merkit (piste, pilkku jne.).
Mielestäni kaikki on selvää sellaisenaan, ilman yksityiskohtaisia selityksiä. Voisitko kuitenkin käsitellä skriptilläsi (mukaan lukien välimerkit) seuraavat tekstit:
Ja julkaise sitten tilastot? Minusta se näytti? että tekstit heijastavat mahdollisimman paljon nykyaikaista puhettamme, mutta silti puhumme ja kirjoitamme tekstiviestejä.
Kiitos paljon etukäteen.

Joten on kaksi tapaa analysoida kirjainten toistotiheyttä. Menetelmä 1. Ota teksti, etsi siitä ainutlaatuisia (ei-toistuvia) sanamuotoja ja analysoi niitä. Menetelmä on hyvä tilastojen rakentamiseen venäjän kielen sanojen, ei tekstien, perusteella. Menetelmä 2. Älä etsi tekstistä ainutlaatuisia sanoja, vaan siirry suoraan kirjainten toistotiheyden laskemiseen. Saamme kirjainten tiheyden venäjän tekstissä, emme venäläisissä sanoissa. Luodaksesi näppäimistöjä ja muita asioita, sinun on käytettävä täsmälleen tätä menetelmää: tekstit kirjoitetaan näppäimistöllä.

Näppäimistöjen tulee ottaa huomioon kirjainten tiheyden lisäksi myös pysyvimmät sanat (sanamuodot). Ei ole niin vaikea arvata, mitkä sanat ovat yleisimmin käytettyjä: nämä ovat ensinnäkin virallinen puheenosat, koska niiden tehtävänä on palvella aina ja kaikkialla, ja pronominit, joiden rooli ei ole vähemmän tärkeä: korvata mikä tahansa asia/henkilö puheessa (tämä, hän, hän). No, tärkeimmät verbit (olla, sanoa). Yllä lueteltujen tekstien analyysin tulosten perusteella sain seuraavat "suositut" sanat: "ja, ei, tuossa, hän, minä, on, kanssa, hän, miten, mutta, hänen, tämä, to , a, kaikki, hän, oli, niin, sitten, sanoi, sillä, sinä, oi, at, hän, minä, vain, sillä, minä, kyllä, sinä, alkaen, oli, milloin, alkaen, varten, vielä, nyt , he sanoivat, jo, hän, ei, oli, hänen, olla, no, eikä, jos, ei mitään, täällä, hän itse, niin että, itselleen, tämä, ehkä, tuo, ennen, me, he, oliko, oliko, on kuin tai, hän" ja niin edelleen.

Palatakseni näppäimistöihin, on selvää, että näppäimistössä kirjainyhdistelmien "ei", "mitä", "hän", "on" ja muut tulisi olla mahdollisimman lähellä toisiaan tai jos eivät lähekkäin, niin jossain optimaalisessa tapa. On tarpeen tehdä tutkimusta siitä, miten sormet liikkuvat tarkalleen näppäimistön poikki, löytää "mukavimmat" asennot ja sijoittaa niihin yleisimmin käytetyt kirjaimet, unohtamatta kuitenkaan kirjainyhdistelmiä.

Ongelma on, kuten aina, yksi: vaikka olisi mahdollista luoda ainutlaatuinen näppäimistö, mitä tapahtuu miljoonille ihmisille, jotka ovat jo tottuneet qwerty/ytsukeniin?

Mitä tulee mobiililaitteisiin... Luultavasti siinä on järkeä. Ainakin kirjainten "o", "a", "e" ja "i" on oltava täsmälleen samassa näppäimessä. Välimerkit käyttötiheyden järjestyksessä: , . - ? ! "; :)(

- — Aiheet tietojen suojaus FI sanan käyttötiheys … Teknisen kääntäjän opas

Y; taajuudet; ja. 1. to Frequent (1 numero). Tarkkaile liikkeiden toistotiheyttä. Pakollinen osa perunoiden istutusta. Kiinnitä huomiota pulssiisi. 2. Identtisten liikkeiden toistojen lukumäärä, värähtelyt mihin suuntaan. aikayksikkö. Pyörän kiertotunnit. H... tietosanakirja

I Alkoholismi on krooninen sairaus, jolle on ominaista psyykkisten ja somaattisten häiriöiden yhdistelmä, joka johtuu järjestelmällisestä alkoholin väärinkäytöstä. A. x:n tärkeimmät ilmentymät. ovat muuttuneet kestävyyteen ... ... Lääketieteellinen tietosanakirja

KAAPATA- yksi venäläisissä koukkulevyissä käytetyistä erityistermeistä. epälineaarinen polyfonia, jolle on tunnusomaista kehittynyt subvokaalinen polyfoninen rakenne ja pystysuoran terävä dissonanssi. Laulaminen termin täytäntöönpanoa nykypäivänä. aikaa ei ole tutkittu... Ortodoksinen Encyclopedia

Tyylistatistinen tekstianalyysimenetelmä- on matemaattisten tilastojen työkalujen käyttöä stilistiikan alalla määrittämään puheessa toimivat kielen tyypit, kielen toimintamallit eri kommunikaatioalueilla, tekstityypit, erityiset toiminnallisuudet. tyylejä ja...

Annosmaustettu nuuska, miniannos Nuuska on tupakkatuotetyyppi. Se on murskattua kostutettua tupakkaa, joka asetetaan ylähuulen (harvemmin alahuulen) ja ikenien väliin... Wikipedia

Tieteellinen tyyli- esittelee tieteellistä. viestintä- ja puhetoiminnan ala, joka liittyy tieteen toteuttamiseen sosiaalisen tietoisuuden muotona; heijastaa teoreettista ajattelua, joka esiintyy käsitteellisesti loogisessa muodossa, jolle on ominaista objektiivisuus ja abstraktio... Venäjän kielen tyylillinen tietosanakirja

- (erikoiskirjallisuudessa myös isänimi) osa sukunimestä, joka on annettu lapselle isän nimen mukaan. Isännimien muunnelmat voivat yhdistää kantajansa kaukaisiin esi-isiisi, isoiseihin, isoisoiseihin... ... Wikipedia

Yleinen käyttö, sovellettavuus, yleisyys, sovellettavuus, markkinoitavuus, yleisesti hyväksytty venäjän synonyymien sanakirja. käyttö substantiivi, synonyymien määrä: 10 yleisesti hyväksytty (11) ... Synonyymien sanakirja

Päättely- - toiminnallisesti semanttinen puhetyyppi (katso) - (FSTR), joka vastaa abstraktin ajattelun muotoa - päätelmä, suorittaa erityistä kommunikatiivista tehtävää - antaa puheelle perusteltu luonne (päästyä loogisesti uuteen tuomioon tai ... ... Venäjän kielen tyylillinen tietosanakirja

Haluan varoittaa, että tässä artikkelissa esitetyt tiedot ovat jokseenkin vanhentuneita. En kirjoittanut sitä uudelleen, jotta voisin myöhemmin verrata SEO-standardien muuttumista ajan myötä. Löydät ajankohtaista tietoa tästä aiheesta uusista materiaaleista:

Hei, rakkaat blogisivuston lukijat. Tämän päivän artikkeli on jälleen omistettu sellaiselle aiheelle kuin verkkosivustojen hakukoneoptimointi (). Aiemmin olemme jo käsitelleet monia asioita, jotka liittyvät sellaiseen käsitteeseen kuin.

Tänään haluan jatkaa keskustelua sisäisestä hakukoneoptimoinnista ja selventää joitain aiemmin esiin nostettuja kohtia sekä puhua siitä, mistä emme ole vielä keskustelleet. Jos osaat kirjoittaa hyviä ainutlaatuisia tekstejä, mutta et kiinnitä tarpeeksi huomiota siihen, kuinka hakukoneet näkevät ne, he eivät pääse hakutulosten kärkeen kyselyissä, jotka liittyvät ihanaan aiheeseen. artikkeleita.

Mikä vaikuttaa tekstin osuvuuteen hakukyselyn kannalta?

Ja tämä on erittäin surullista, koska tällä tavalla et ymmärrä projektisi täyttä potentiaalia, joka voi osoittautua erittäin vaikuttavaksi. Sinun on ymmärrettävä, että hakukoneet ovat suurimmaksi osaksi typeriä ja yksinkertaisia ohjelmia, jotka eivät pysty ylittämään kykyjään ja katsomaan projektiasi ihmissilmin.

He eivät näe paljon kaikkea hyvää ja tarpeellista projektissasi (mitä olet valmistanut vierailijoille). He osaavat vain analysoida tekstiä ottamalla huomioon monet komponentit, mutta he ovat silti hyvin kaukana ihmisen havainnosta.

Siksi meidän on kiivettävä ainakin väliaikaisesti hakurobottien kenkiin ja ymmärrettävä, mihin he kiinnittävät huomionsa sijoitellessaan erilaisia tekstejä erilaisille hakukyselyille (). Ja tätä varten sinulla on oltava käsitys siitä, tätä varten sinun on luettava toimitettu artikkeli.

Yleensä he yrittävät käyttää avainsanoja sivun otsikossa, joissakin sisäisissä otsikoissa ja myös jakaa ne tasaisesti ja mahdollisimman luonnollisesti koko artikkelissa. Kyllä, tietysti myös tekstin korostusnäppäimiä voidaan käyttää, mutta ei pidä unohtaa ylioptimointia, joka voi johtaa.

Tekstin näppäintiheys on myös tärkeä, mutta nyt tämä ei ole mieluummin toivottava tekijä, vaan päinvastoin, varoitus - ei pidä liioitella.

Asiakirjan avainsanan esiintymistiheyden määrittäminen on melko yksinkertaista. Itse asiassa tämä on sen käyttötiheys tekstissä, joka määritetään jakamalla sen esiintymisten määrä asiakirjassa asiakirjan pituudella sanoissa. Aiemmin sivuston sijainti hakutuloksissa riippui suoraan tästä.

Mutta luultavasti ymmärrät, että kaikkea materiaalia ei ole mahdollista koota vain avaimista, koska se on lukukelvoton, ja luojan kiitos tämä ei ole välttämätöntä. Miksi kysyt? Kyllä, koska avainsanan käyttöä tekstissä on rajoitettu, minkä jälkeen asiakirjan relevanssi tämän avainsanan sisältävälle kyselylle ei enää kasva.

Nuo. Riittää, että saavutamme tietyn taajuuden ja optimoimme sen siten mahdollisimman paljon. Tai sitten liioittelemme ja jäämme suodattimen alle.

On vielä ratkaistava kaksi kysymystä (ja ehkä kolme): mikä on tämä avainsanan esiintymistiheys, jonka jälkeen on jo vaarallista lisätä sitä, ja myös selvittää.

Tosiasia on, että korostustunnisteilla korostetuilla ja TITLE-tunnisteeseen suljetuilla avainsanoilla on enemmän haun painoarvoa kuin vastaavilla avainsanoilla, jotka näkyvät yksinkertaisesti tekstissä. Mutta viime aikoina verkkovastaavat ovat alkaneet käyttää tätä ja lähettäneet tämän tekijän kokonaan roskapostiksi, minkä vuoksi sen merkitys on vähentynyt ja voi jopa johtaa koko sivuston kieltämiseen vahvuuksien väärinkäytön vuoksi.

Mutta TITLE-näppäimet ovat edelleen relevantteja, on parempi olla toistamatta niitä siellä eikä yrittää tukkia liikaa yhden sivun otsikkoon. Jos avainsanat ovat otsikossa, voimme merkittävästi vähentää niiden määrää artikkelissa (ja siksi tehdä siitä helppolukuisemman ja sopivamman ihmisille, ei hakukoneille), saavuttaen saman merkityksen, mutta ilman vaaraa suodatin.

Mielestäni tässä kysymyksessä kaikki on selvää - mitä enemmän avaimia on aksentti- ja TITLE-tunnisteiden sisällä, sitä suurempi on mahdollisuus menettää kaikki kerralla. Mutta jos et käytä niitä ollenkaan, et myöskään saavuta mitään. Tärkein kriteeri on avainsanojen sisällyttämisen tekstiin luonnollisuus. Jos ne ovat olemassa, mutta lukija ei kompastu niihin, niin kaikki on hienoa.

Nyt on vielä selvitettävä, mikä avainsanan käyttötiheys asiakirjassa on optimaalinen, jonka avulla voit tehdä sivusta mahdollisimman merkityksellisen, eikä se aiheuta sanktioita. Muistakaamme ensin kaava, jota useimmat (luultavasti jopa kaikki) hakukoneet käyttävät sijoituksen luomiseen.

Kuinka määrittää näppäimen sallittu käyttötaajuus

Olemme jo puhuneet matemaattisesta mallista juuri edellä mainitussa artikkelissa. Sen olemus tälle tietylle hakukyselylle ilmaistaan yhdellä yksinkertaistetulla kaavalla: TF*IDF. Missä TF on tämän kyselyn välitön esiintymistiheys asiakirjan tekstissä (tiheys, jolla sanat esiintyvät siinä).

IDF on tietyn kyselyn käänteinen esiintymistiheys (harvinaisuus) kaikissa muissa tietyn hakukoneen indeksoimissa Internet-asiakirjoissa (kokoelmassa).

Tämän kaavan avulla voit määrittää asiakirjan vastaavuuden (relevanssin) hakukyselyn kanssa. Mitä korkeampi tuotteen TF*IDF arvo on, sitä merkityksellisempi asiakirja on ja sitä korkeampi se on, kun kaikki muut asiat ovat samat.

Nuo. käy ilmi, että asiakirjan paino tietylle kyselylle (sen noudattaminen) on suurempi, mitä useammin tämän kyselyn avaimia käytetään tekstissä ja mitä harvemmin näitä avaimia löytyy muista Internet-asiakirjoista.

On selvää, että emme voi vaikuttaa IDF:ään, paitsi valitsemalla toisen pyynnön, jota varten optimoimme. Mutta voimme ja aiomme vaikuttaa TF:ään, koska haluamme napata osamme (eikä pienen) Yandexin ja Googlen hakutulosten liikenteestä tarvitsemiemme käyttäjien kysymyksiin.

Mutta tosiasia on, että hakualgoritmit laskevat TF-arvon melko ovelalla kaavalla, joka ottaa huomioon avainsanan käyttötiheyden lisääntymisen tekstissä vain tiettyyn rajaan asti, minkä jälkeen TF:n kasvu käytännössä pysähtyy huolimatta se, että lisäät taajuutta. Tämä on eräänlainen roskapostisuodatin.

Suhteellisen kauan sitten (noin vuoteen 2005 asti) TF-arvo laskettiin melko yksinkertaisella kaavalla ja se oli itse asiassa yhtä suuri kuin avainsanan esiintymistiheys. Hakukoneet eivät täysin pitäneet osuvuuden laskemisen tuloksista tällä kaavalla, koska ne panostivat roskapostittajille.

Sitten TF-kaavasta tuli monimutkaisempi, ilmaantui sellainen käsite kuin sivupahoinvointi ja se alkoi riippua paitsi esiintymistiheydestä myös muiden sanojen käyttötiheydestä samassa tekstissä. Ja optimaalinen TF-arvo voitaisiin saavuttaa, jos avain osoittautuisi useimmin käytetyksi sanaksi.

TF-arvoa oli myös mahdollista kasvattaa suurentamalla tekstin kokoa samalla kun esiintymisprosentti säilyi. Mitä suurempi pyyhe, jossa artikkelissa on sama avainten prosenttiosuus, sitä korkeampi asiakirja on.

Nyt TF-kaavasta on tullut entistä monimutkaisempi, mutta samaan aikaan meidän ei tarvitse tuoda tiheyttä arvoon, kun tekstistä tulee lukukelvoton ja hakukoneet määräävät kieltää projektimme roskapostin takia. Eikä nytkään tarvitse kirjoittaa suhteettoman pitkiä arkkeja.

Säilyttämällä sama ideatiheys (määritämme sen juuri alempana vastaavasta kaaviosta), artikkelin koon lisääminen sanoin parantaa sen sijaintia hakutuloksissa vain tiettyyn pituuteen asti. Kun olet saavuttanut ihanteellisen pituuden, sen lisääminen ei vaikuta osuvuuteen (tarkemmin sanottuna, mutta hyvin, hyvin vähän).

Kaikki tämä näkyy selvästi, jos rakennat kaavion tämän hankalan TF:n (suora esiintymistiheys) perusteella. Jos tämän kaavion yhdellä asteikolla on TF ja toisella asteikolla - prosenttiosuus avainsanan esiintymistiheydestä tekstissä, tuloksena saadaan ns. hyperboli:

Kaavio on tietysti likimääräinen, koska harvat ihmiset tietävät todellisen TF-kaavan, jota Yandex tai Google käyttävät. Mutta laadullisesti se voidaan määrittää optimaalinen alue, johon taajuuden tulisi sijaita. Tämä on noin 2-3 prosenttia sanojen kokonaismäärästä.

Jos ajattelet, että liität myös joitain avaimia aksenttitunnisteisiin ja TITLE-otsikkoon, tämä on raja, jonka jälkeen tiheyden lisääminen voi olla täynnä kieltoa. Ei ole enää kannattavaa kyllästää ja vääristää tekstiä suurella määrällä avainsanoja, koska siinä on enemmän miinuksia kuin plussia.

Kuinka pitkä teksti riittää promootioon?

Saman oletetun TF:n perusteella voidaan piirtää sen arvo suhteessa pituuteen sanoissa. Tässä tapauksessa voit ottaa avainsanojen tiheydeksi vakioksi minkä tahansa pituuden ja olla yhtä suuri esimerkiksi mihin tahansa arvoon optimaalisesta alueesta (2–3 prosenttia).

Huomionarvoista on se, että saamme täsmälleen samanmuotoisen kaavion kuin edellä käsitelty, vain tekstin pituutta tuhansissa sanoissa säädetään x-akselia pitkin. Ja siitä on mahdollista tehdä johtopäätös optimaalinen pituusalue, jossa lähes maksimi TF-arvo on jo saavutettu.

Tuloksena käy ilmi, että se on 1000-2000 sanaa. Lisäkasvun myötä relevanssi ei käytännössä kasva, ja lyhyemmällä pituudella se laskee melko jyrkästi.

Että. Voimme päätellä, että jotta artikkelisi sijoittuisivat korkealle hakutuloksissa, sinun on käytettävä tekstissä avainsanoja vähintään 2-3 %:n tiheydellä. Tämä on ensimmäinen ja tärkein johtopäätös, jonka teimme. No, toinen asia on, että nyt ei ole ollenkaan tarpeen kirjoittaa kovin laajoja artikkeleita päästäkseen huipulle.

Riittää, kun ylittää 1000 - 2000 sanan kynnys ja sisällyttää siihen 2-3% avainsanoista. Siinä kaikki - siinä se resepti täydelliseen tekstiin, joka pystyy kilpailemaan paikasta huipulla matalataajuuksisilla kyselyillä jopa ilman ulkoista optimointia (ostolinkit tähän artikkeliin ankkureilla, jotka sisältävät avaimia). Tosin, seikkaile vähän Miralinkse , GGL, Rotapost tai GetGoodLink, voit, koska se auttaa projektissasi.

Muistutan vielä kerran, että voit selvittää kirjoittamasi tekstin pituuden sekä tiettyjen avainsanojen käyttötiheyden siinä, käyttämällä erikoisohjelmia tai käyttämällä niiden analysointiin erikoistuneita verkkopalveluita. Yksi näistä palveluista on ISTIO, työskentelystä, jonka kanssa puhuin.

Kaikki, mitä sanoin edellä, ei ole sataprosenttisesti luotettavaa, mutta hyvin samanlainen kuin totuus. Joka tapauksessa henkilökohtainen kokemukseni vahvistaa tämän teorian. Mutta Yandexin ja Googlen algoritmit muuttuvat jatkuvasti, ja harvat ihmiset tietävät, kuinka se tulee olemaan huomenna, paitsi ne, jotka ovat lähellä kehitystä tai kehittäjiä.

Onnea sinulle! Nähdään pian blogisivuston sivuilla

Saatat olla kiinnostunut

Sisäinen optimointi - avainsanan valinta, pahoinvoinnin tarkistus, optimaalinen otsikko, sisällön kopiointi ja linkittäminen LF:n alle
Avainsanat tekstissä ja otsikoissa
Miten avainsanat vaikuttavat verkkosivuston edistämiseen hakukoneissa
Verkkopalvelut verkkovastaaville – kaikki mitä tarvitset artikkeleiden kirjoittamiseen, hakukoneoptimointiin ja sen menestyksen analysointiin
Menetelmät sisällön optimoimiseksi ja sivuston teeman huomioon ottamiseksi linkin mainostamisen aikana kustannusten minimoimiseksi
Yandex Wordstat ja semanttinen ydin - avainsanojen valinta verkkosivustolle Wordstat.Yandex.ru-verkkopalvelun tilastojen avulla
Ankkuri - mitä se on ja kuinka tärkeitä ne ovat verkkosivuston edistämisessä?
Mitkä hakukoneoptimoinnin tekijät vaikuttavat verkkosivuston edistämiseen ja missä määrin?
Sivuston edistäminen, edistäminen ja optimointi itse
Ottaen huomioon kielen morfologian ja muut hakukoneiden ratkaisemat ongelmat sekä eron korkean taajuuden, keskialueen ja matalan taajuuden kyselyjen välillä
Sivuston luottamus - mitä se on, miten sitä mitataan XToolsissa, mikä vaikuttaa siihen ja kuinka lisätä sivustosi arvovaltaa

Sanakirja sisältää yleisimmät modernin venäjän kielen sanat (1900-luvun toinen puolisko – 2000-luvun alku), jotka on varustettu tiedoilla käyttötiheydestä, tilastollisesta jakautumisesta tekstin ja genren mukaan sekä tekstien luomisajankohdan mukaan. . Sanakirja perustuu 100 miljoonan sanan venäjän kielen kansalliskokouksen teksteihin. Lisätietoa venäjän kielen taajuussanakirjojen historiasta ja "Venäjän sanaston uusi taajuussanakirja" -sanakirjan luomismenetelmistä voi lukea.

Sanakirjan konseptin kehittivät ja valmisteli julkaistavaksi O.N. Lyashevskaya ja S.A. Sharov, sähköisen version valmisteli A.V. Sannikov. Kirjoittajat ilmaisevat kiitoksensa V. A. Plungjanille, A. Ya. Shaikevichille, E. A. Grishinalle, B. P. Kobritsoville, E. V. Rakhilinalle, S. O. Savchukille, D. V. Sichinavalle ja muille NCRY-seminaarin osallistujille, jotka osallistuivat keskusteluun sanakirjan luomisen periaatteista . Kiitämme O. Uryupinaa, D. ja G. Bronnikovsia, B. Kobritsovia sekä Yandex LLC:n työntekijöitä A. Abroskinia, N. Grigorjevia, A. Sokirkoa avusta aineiston keräämisen ja tietokonekäsittelyn eri vaiheissa.

Kuinka löytää sana sanakirjasta?

Sanakirjan kaksi pääosaa ovat luettelo sanoja, jotka on järjestetty aakkosjärjestykseen ja yleisen käyttötiheyden mukaan. Kaikki sanat annetaan alkuperäisessä (alkuperäisessä) muodossaan: nimille tämä on nominatiivitapausmuoto (substantiivien kohdalla pääsääntöisesti yksikkömuoto, adjektiiveille - täysi maskuliininen muoto), verbeille - infinitiivimuoto.

Aakkosellinen luettelo sisältää 60 tuhatta yleisintä sanamuotoa. Löydät tietoja halutusta sanasta siirtymällä osioon, valitsemalla sanan ensimmäinen kirjain ja etsimällä etsimäsi sanan taulukosta. Voit löytää sanan nopeasti myös hakukentän avulla, esimerkiksi:

Sana: loistava

Tällä tavalla voit löytää tietoa tietystä sanasta, mutta myös sanaryhmästä, joka alkaa tai päättyy samalla tavalla. Käytä tätä varten hakuikkunassa tähteä (*) kirjoitetun kirjainsarjan jälkeen ("kaikki sanat alkavat...") tai ennen kirjainmerkkijonoa ("kaikki sanat, jotka päättyvät...". esimerkiksi, jos haluat löytää kaikki sanat, jotka alkavat uudelleen, kirjoita hakukenttään:

Sana: re*

Jos haluat löytää kaikki sanat, jotka päättyvät vain vähän, kirjoita hakukenttään:

Sana: *ei

Lemmojen taajuusluettelossa sanat on järjestetty yleisen käyttötaajuuden mukaan nykyvenäläisen kirjallisen kielen rungossa. Taajuuslistalla on 20 000 yleisimmin käytettyä lemmaa.

Löydät tietoja halutusta sanasta siirtymällä osioon ja etsimällä haluamasi sana taulukosta. Jos haluat etsiä tietoja yksittäisistä sanoista, on parasta käyttää pikahakuikkunaa.

Miksi en löydä sanaa sanakirjasta, vaikka löydän sen korpuksesta?

Tämä voi johtua useista syistä. Ensinnäkin sana voi olla matalataajuinen (esimerkiksi vain 3 esiintymää korpusessa) tai sitä voidaan käyttää vain ennen vuotta 1950 kirjoitetuissa teksteissä. Toiseksi sana voi esiintyä monta kertaa, mutta yhdessä tai kahdessa tekstissä: tällaiset lemmat jätettiin tarkoituksella sanakirjasta pois. Kolmanneksi emme voi sulkea pois sitä, että sanan alkuperäisen muodon tai puheosan ominaisuuksien automaattisessa määrittämisessä tapahtui virhe tai että sana on virheellisesti liitetty erisnimiksi. Sivusto esittelee "testi"-version taajuussanakirjasta, ja jatkamme työtä sen leksikaalisen koostumuksen selkeyttämiseksi.

Mitä tietoa voit saada sanan käytöstä?

Sanakirjasta saat seuraavat tiedot sanan käytöstä korpuksessa:

lemman käyttökertojen kokonaismäärä (kokonaistaajuus ipm-yksiköissä), katso osiot, kaunokirjallisuuden taajuussanakirjat ja muut toiminnalliset tyylit; substantiivien, verbien ja muiden puheen osien taajuussanakirjat

sanan taajuusarvo (eli yleisen taajuusluettelon sarjanumero), katso kohdat, substantiivien, verbien ja muiden puheen osien taajuussanakirjat.

tekstien lukumäärä, joissa sana esiintyi (asiakirjojen lukumäärä), katso kohta;

variaatiokerroin D, katso substantiivien, verbien ja muiden puheenosien osiot ja taajuussanakirjat

sanankäytön jakautuminen eri vuosikymmeninä syntyneissä teksteissä (1950-, 1960-luvut jne.), katso kohta;

yksittäisten sanamuotojen yleinen käyttötiheys, katso kohta Sanamuotojen aakkosellinen luettelo.

Mielenkiintoisen sanaston sanakirjoista saat tietoa myös sanan vertailutiheydestä yleiskorpuksessa ja tietyn toiminnallisen tyylin tekstien (fiktio, journalismi jne.) alikorpuksessa sekä LL-pistemäärän todennäköisyysindikaattorista.

Määrällisten indikaattoreiden lisäksi sanalle ilmoitetaan sanan osa. Tämä tehdään sanojen erottamiseksi eri puheen osista, joilla on sama alkuperäinen muoto (vrt. leipoa - substantiivi ja verbi).

Mikä on ipm?

Kokonaisfrekvenssi kuvaa esiintymien lukumäärää korpuksen miljoonaa sanaa kohden tai ipm (instanssia miljoonaa sanaa kohti). Tämä on maailmankäytännössä yleisesti hyväksytty taajuuden mittayksikkö, joka yksinkertaistaa sanataajuuden vertailua eri taajuussanakirjoissa ja eri korpusissa. Tosiasia on, että tekstinäytteet, joilla taajuutta mitataan, voivat vaihdella kooltaan melko paljon. Esimerkiksi jos sana tehoa esiintyy 55 kertaa 400 000 sanan korpuksessa, 364 kertaa miljoonissa ja 40 598 kertaa 100 miljoonan sanan korpuksessa modernin venäjän kielen ja 55 673 kertaa suuressa 135 miljoonan NKRY:n korpuksessa, sitten sen taajuus ipm:nä on 137,5, 364,0, 372,06 ja 412,39.

Taajuussanakirjat, toim. L.N. Zasorina ja L. Lenngren rakennettiin vastaavasti miljoonan sanan käytön otokseen, voidaan olettaa, että siellä esiintyvät absoluuttiset indikaattorit on annettu myös ipm:ssä.

Mikä on variaatiokerroin D?

A. Juillandin (Juilland et al. 1970) käyttöön ottama kerroin D on käytössä monissa taajuussanakirjoissa (L. Lenngrenin venäjänkielinen sanakirja, British National Corpuksen sanakirja, ranskankielisen sanaston sanakirja liike-elämässä). Tämän kertoimen avulla voit nähdä, kuinka tasaisesti sana jakautuu eri teksteissä.

Kertoimen arvo määritetään välillä 0 - 100. Esimerkiksi sana Ja esiintyy lähes kaikissa korpuksen teksteissä ja sen D-arvo on lähellä 100. Sana komissurotomia esiintyy 5 kertaa korpuksessa, mutta vain yhdessä tekstissä; sen D-arvo on noin 0.

Kun kerroin D määritetään jokaiselle sanalle, voidaan arvioida, kuinka erityistä se on yksittäisille aihealueille. Esimerkiksi sanat ylikypsä Ja istuttaa niillä on suunnilleen sama taajuus (0,56 ipm), mutta samaan aikaan kerroin D ylikypsä on yhtä suuri 90, a implantissa - 0. Tämä tarkoittaa, että ensimmäinen sana esiintyy tasaisesti eri suuntaisissa teksteissä ja on merkittävä useille aihealueille, kun taas sana istuttaa esiintyy vain muutamissa teksteissä aiheesta "lääketiede ja terveys".

Mitä voit oppia sanan käytön historiasta eri aikakausina?

Tietoa sanataajuuden jakautumisesta eri vuosikymmeninä 1900-luvun toisella puoliskolla ja 2000-luvun alussa saa osoitteesta. Voit esimerkiksi nähdä kuinka sanan kohtalo kehittyi perestroika:

Sen käytön jyrkkä nousu 1980-luvulla on hyvin selitettävissä tuon ajan sosiohistoriallisilla todellisuuksilla; samalla kielellisestä näkökulmasta tämä tosiasia voidaan tulkita näin: sana perestroika rikastui uudella merkityksellä, josta tuli hallitseva myöhempinä vuosina.

Miksi erisnimet ja lyhenteet sisällytetään erilliseen luetteloon?

Erissubstantiivit on erotettu sanakirjan pääosasta, koska ne muodostavat tilastollisesti paljon vähemmän vakaan ryhmän ja niiden esiintymistiheys riippuu pitkälti korpuksen tekstien valinnasta ja aiheesta (erityisesti sanaston paikasta ja ajasta). kuvatut tapahtumat). Lenngren 1993 ilmaisi mielipiteen, että erisnimien sisällyttäminen taajuussanakirjaan yleisesti johtaa väistämättä sen ennenaikaiseen vanhentumiseen.

Sanakirja sisältää tämän luettelon ydinvoimaosan 3 000 yleisin yksikkönä. Jos haluat etsiä tietoja etunimien, isänimien, sukunimien, lempinimien, lempinimien, toponyymien, organisaatioiden nimien ja lyhenteiden käytöstä, siirry osioon Aakkosellinen luettelo erisnimistä ja lyhenteistä, valitse kirjain, jolla etsimäsi sana alkaa ja etsi se taulukosta. Voit myös käyttää pikahakuikkunaa.

Mistä saan tietoa sanan yksittäisten muotojen käytöstä?

Lemman (eli sanan kaikissa taivutusmuodoissa) käyttöä koskevien tietojen lisäksi sanakirjasta saat selville, miten yksittäisiä sanamuotoja käytetään. Siirry Aakkosellinen sanamuotoluettelo -osioon, valitse kirjain, jolla sanamuoto alkaa, ja etsi se taulukosta. Voit myös käyttää pikahakuikkunaa, esimerkiksi:

Sanamuoto: lentää

Jos haluat etsiä kaikki sanamuodot, jotka alkavat (tai päättyvät) tietyllä kirjainsarjalla, käytä tähtimerkkiä (*) hakukentässä. Esimerkiksi kaikki sanamuodot, jotka alkavat eutanasia-, löytyy kirjoittamalla:

Sanamuoto: nukkua*

Kaikki sanamuodot, jotka päättyvät ¬ -ic, löytyy kirjoittamalla:

Sanamuoto: *hikka

Aakkosellinen sanamuotoluettelo sisältää kaikki rungon sanamuodot, joiden esiintymistiheys on yli 0,1 ipm (yhteensä noin 15 tuhatta) ja sisältää tietoa niiden yleisestä esiintymistiheydestä. Homonyymiset sanamuodot on merkitty taulukossa *.

Kuinka löytää tietoa "yleisistä" sanoista?

Sanakirjastamme löydät tietoa sanaluokista, jotka eroavat yleisistä tilastollisista ominaisuuksista. Näitä ovat erityisesti:

yleisimmät sanat korpuksesta; yleisen näytteen keskimääräiset taajuussanat jne. (katso kohta);

kaunokirjallisuuden alakorpuksesta yleisimmin löydetyt sanat (katso osio Frequency Dictionary of Fiction);

journalismin alakorpuksessa yleisimmin esiintyvät sanat (katso kohta Journalismin frekvenssisanakirja);

sanat, jotka esiintyvät useimmin muun tietokirjallisuuden alakorpuksessa (katso muun tietokirjallisuuden taajuussanakirja);

sanat, jotka ovat suullisen puheen tyypillisimpiä (katso kohta Frequency Dictionary of Living Oral Speech).

yleisimmät substantiivit (katso kohta Substantiivien esiintymistiheysluettelo);

yleisimmät verbit (katso kohta Verbien tiheysluettelo);

ja muut osittaisten puheluokkien taajuusluettelot.

Ehdotettujen luokkien lisäksi voit itsenäisesti tutkia muita sanaryhmiä käyttämällä "Yleinen aakkosellinen luettelo" -taulukkoa Sanamuotojen aakkosellinen luettelo -osiossa (voit esimerkiksi tutkia yleisimpiä verbejä etuliitteellä uudelleen, sanoja löytyy yli 200 tekstistä ja paljon muuta: luokkaryhmittelyn periaatteet riippuvat tehtävistäsi ja mielikuvituksestasi).

Kuinka jäljittää taajuusjakaumaa eri toiminnallisissa teksteissä?

L.N. Zasorinan taajuussanakirja tarjoaa tietoa sanojen käytöstä neljän tyyppisissä teksteissä: (I) sanomalehti- ja aikakauslehtitekstit, (II) draama, (III) tieteellinen ja journalistinen teksti, (IV) taiteellinen proosa. Sanakirjastamme saat vastaavaa tietoa käyttämällä osiota ”Lemmojen jakautuminen toiminnallisten tyylien mukaan”.

Funktionaalisten tyylien taajuussanakirjoja laaditaan kaunokirjallisuuden, journalismin, muun tietokirjallisuuden ja elävän suullisen puheen alakorjausten pohjalta. Verrattuna L. N. Zasorinan sanakirjaan otsikoiden koostumusta on hieman muutettu: dramaturgian sijaan käytetään elävän suullisen puheen tallenteita ja elokuvan ääniraitojen transkriptioita, tieteellinen kirjallisuus on jaettu erilliseen osioon, sekä virka-, kirkko- ja muuta tietokirjallisuutta.

Luettelo sisältää 5 000 yleisintä näiden alakorporaiden lemmaa. Jokaiselle lemmalle ilmoitetaan puheen osa, taajuus alikorpuksessa ja kerroin D.

Mikä on merkityksellisen sanaston sanakirja (kaunokirjallisuus jne.)?

On sanoja, joita käytetään paljon useammin yhdessä toiminnallisista tyyleistä kuin muissa. Esimerkiksi elävässä suullisessa puheessa tällaisia sanoja ovat täällä, yleisesti Ja OK. On todellakin vaikea kuvitella, että tieteellisessä ja teknisessä kirjallisuudessa näitä sanoja käytetään yhtä usein kuin jokapäiväisessä kielessä.

Luettelo tyypillisimmistä lemmoista kullekin toiminnalliselle tekstityypille tunnistettiin perustuen lemmien esiintymistiheyden vertailuun tietyssä tekstin alikorpuksessa ja muussa korpuksessa. Merkittävän sanaston sanakirjat sisältävät 500 lemmaa.

Mitä indikaattorit frq1, frq2 ja LL-pisteet tarkoittavat merkityksellisen sanaston sanakirjassa?

Frq1 on lemman yleinen taajuus koko korpuksessa (ipm-yksiköissä), frq2 on lemman taajuus tietyssä alakorpuksessa (fiktio-, journalismi-, muun tietokirjallisuuden ja elävän puhutun kielen alakorpus, vastaavasti), LL-piste on todennäköisyyssuhde, joka lasketaan frq1:n ja frq2:n perusteella P. Raysonin ja A. Garsiden ehdottaman kaavan mukaan (katso tästä lisää sanakirjan johdannossa). Mitä korkeampi LL-pistemäärä on, sitä tärkeämpi sana on tietylle toiminnalliselle tyylille.

Kuinka saada luettelo 100 yleisimmästä verbistä?

Kohdassa ”Yleinen sanasto: puheenosat” lemmien taajuusluettelo on jaettu seitsemään alaluetteloon: substantiivit, verbit, adjektiivit, adverbit ja predikaatit, pronominit, numerot ja apupuheen osat. Tässä on jokaiselle lemmalle osoitettu sen yleinen esiintymistiheys ja sijoitus (järjestysnumero) yleisessä luettelossa. Jokainen luettelo sisältää 1000 yleisintä lemmaa.

Siten voit saada luettelon 100 yleisimmästä verbistä menemällä Frequency Verb List -alaosioon ja valitsemalla luettelon yläosasta ensimmäiset 100 verbiä. Vastaavasti voit selvittää, mikä adjektiivi on yleisin (kuten osiossa Adjektiivien esiintymistiheysluettelo, tämä adjektiivi Uusi) ja saat selville monia muita mielenkiintoisia faktoja osapuheluokkien kokoonpanosta.

Kuinka käyttää aputaulukoita?

Aputaulukot sisältävät ensinnäkin tiedot osapuheluokkien esiintymistiheydestä sekä muita kielioppiluokkia. Nämä tiedot saatiin NKRY-alikorpuksen perusteella, josta on poistettu (manuaalisesti) leksikaaliset ja kieliopilliset epäselvyydet (yli 6 miljoonan sanan käytön koko). Koska tilastot kattavat suuria sanaluokkia, on syytä uskoa, että puheenosien ja muiden kielioppiluokkien osuus tulee olemaan sama koko korpuksessa.

Toiseksi tässä osiossa on tietoa lekseemien tekstin kattavuudesta, sanan keskimääräisestä pituudesta, sanamuodosta ja lauseesta.

Kolmanneksi, tässä on luettelot venäläisten aakkosten kirjainten, välimerkkien sekä kahden kirjaimen ja monikirjaimien yhdistelmien käyttötavoista.

Myös aiheeseen

Brutto- ja nettotulos

Täydelliset ja epätäydelliset partisiipit

Parlamentaarinen ja dualistinen monarkia - mitä se on?

LLC tai yksittäinen yrittäjä: kumpi on parempi valita?

Kognition tyypit ja niiden ominaisuudet