Sa artikulong ito ay pag-uusapan ko kung ano ang Yandex search engine at kung paano ito gumagana search engine at magbibigay ako ng mga halimbawa ng mga site na nililimitahan ng search engine ng Yandex sa pagraranggo.

Ang search engine ng Yandex, sa mga tuntunin ng katanyagan nito, ay nasa ika-20 sa mundo at ika-1 sa Russia. Opisyal, ang kumpanya ng Yandex ay naaprubahan noong 1997 noong Setyembre 23, nagsimula ang pag-unlad nito sa loob ng balangkas ng kumpanya ng Comp Tek International, at noong 2000 ay nagsimulang umiral ang Yandex bilang isang hiwalay na kumpanya.

Ang mga tagapagtatag ng kumpanya ay sina Volozh Arkady Yurievich, na siyang pangkalahatang direktor, at Segalovich Ilya Valentinovich (1964-2013), tagapagtatag ng Yandex at direktor ng teknolohiya at pag-unlad. Natutunan namin ang kaunti tungkol sa kasaysayan ng Yandex, ngayon ay pag-usapan natin ang search engine nito.

At kaya ang pangunahing direksyon ng kumpanya ng Yandex ay ang search engine, natatanging katangian na pino-pino ang query sa paghahanap. Binibigyang-daan ka ng search engine ng Yandex na maghanap para sa iyong napiling query sa Russian, Ukrainian, Belarusian, Tatar, Kazakh, English, Turkish, German at French, na isinasaalang-alang ang kanilang morphological spelling.

Nakabuo din ang Yandex ng isang masusing algorithm para sa pagtatasa ng kaugnayan at ang prinsipyo ng pagsuri ng mga dokumento nang hindi kasama ang kanilang mga kopya sa iba't ibang mga pag-encode. Hindi tulad ng Google, mas tiyak mula sa algorithm ng pagraranggo ng PR nito - PageRank, isa pa mahalagang punto para sa search engine ng Yandex, ay ang pagpapakilala ng isang thematic citation index - TIC.

Gawain ng Yandex search engine

http://www.yandex.ru
Ang Yandex search engine ay may mga robot, na isang partikular na programa para sa pagsuri sa mga site para sa kanilang kaugnayan. Ang mga robot sa paghahanap ay pumupunta sa site sa pamamagitan ng mga direktang link, pag-index ng mga bagong pahina at pag-save ng mga ito sa kanilang database. Upang ang isang na-index na pahina ng website ay makarating sa TOP, na napakahalaga, kinakailangang isaalang-alang ang mga aspeto ng pag-index tulad ng dalas ng mga keyword sa pahina, ang bilang mga panlabas na link na humahantong sa iyong site, at ang kabuuang bigat ng site, na sinusukat ng naturang indicator bilang Yandex TIC.

Isang halimbawa ng mga site na nililimitahan ng sistema ng Yandex sa pagraranggo

Mga site na may hindi natatanging nilalaman na nakopya o muling isinulat mula sa ibang mga site.

Mga site na masinsinang nagli-link sa isa't isa sa mga grupo.

Mga site na walang kahulugang nilalaman.

Mga site na gumagamit ng mapanlinlang na teknolohiya.

Mga forum at message board na naglalaman ng maraming link na spam.

Mga site na sumusubok na makakuha ng kaugnayan sa pamamagitan ng paglalagay ng mga panlabas na link na hindi isang imbitasyon mula sa may-akda upang bisitahin ang kanyang mapagkukunan.

Ngayon ay nagsimula kami sa isa pang mahabang paglalakbay sa paglalakbay kasama ang mga magarbong landas ng pag-unlad ng search engine ( Yandex, Yandex). Sa tingin ko, ang domestic higante ng online na paghahanap ay matagal nang lumaki sa ganoong antas na hindi masyadong tamad na maghukay sa lahat ng mga sulok nito, alalahanin kung paano nabuo ang Yandex search engine, at kung ano ang kawili-wili sa lahat ng mga taon nito. pag-iral.

Bukod dito, tumatanggap ito ng maraming bisita mula sa search engine ng Yandex. Marami sa kanila ang umaalis sa pamamagitan ng contextual advertising, kinuha ko kamakailan ang blog, kaya sa tingin ko ang kumpanyang ito ay higit pa sa karapat-dapat sa isang malaking publikasyon na isinulat tungkol dito.

Kung isasaalang-alang natin ang Russian Internet, kung gayon ang Yandex ang hindi mapag-aalinlanganan na pinuno. Sa Russia ito ang unang pinakamahalagang search engine. May mga panrehiyong search engine, uri ng mga sangay sa Belarus, Ukraine, at Kazakhstan. Ang Yandex ay napakapopular sa mga residente ng mga bansang ito. Maaari ko itong hatulan ng hindi bababa sa pamamagitan ng mga istatistika, dahil maraming mga bisita ang nagmumula sa ibang mga rehiyon.

Sa kasalukuyan, ang Yandex ay hindi lamang isang search engine, ito rin ay maraming mga serbisyo na ganap na maa-access ng lahat ng mga gumagamit ng search engine na ito. Dito makikita mo at kinakailangang impormasyon, at mag-navigate sa iyong napiling mga aktibidad sa paglilibang, maghanap ng mga larawan, produkto, ihambing ang mga presyo, tingnan ang lagay ng panahon, makipag-usap sa isang social network, manood ng TV at mga iskedyul ng transportasyon. Mayroong maraming mga solusyon sa negosyo. Maaari ka ring pumunta sa Narod.ru. Ang Yandex ay may maginhawang sistema na nagbibigay ng functionality para sa pagtatrabaho sa iyong mga website. Kabilang sa mga pinakabagong magagamit na inobasyon ng serbisyo ay, na nanatiling binayaran sa loob ng mahabang panahon, ngunit noong Disyembre 2011 ang serbisyong ito ay naging available sa ganap na lahat.

Maaari akong magpatuloy tungkol sa magagandang teknolohiya at kapaki-pakinabang na serbisyo ng Yandex sa napakatagal na panahon. Samakatuwid, para sa kadalian ng pagdama ng impormasyon, sisirain ko ang aming paglalakbay sa mga bahagi. Ilalarawan ko ang buong landas ng search engine ayon sa pagkakasunod-sunod ng taon - mula sa paglikha hanggang sa kasalukuyan.

Kasaysayan ng pag-unlad ng Yandex

1980s - 1990s

Kasaysayan ng pag-unlad ng Yandex nag-ugat pabalik sa malayong 80s, sa panahon ng USSR. Noon unang nagsimula ang pagbuo ng software sa paghahanap sa Arcadia. Ang gawain ay isinagawa sa ilalim ng pamumuno ni Arkady Borkovsky at Arkady Volozh. Yun yung una teknolohiya sa paghahanap natanggap ang pangalang "Yandex". At ang website ng Yandex mismo, ang nakikita natin ngayon, ay lumitaw noong 1996. Ang mga pag-unlad na isinasagawa sa oras na iyon ay kinikilala bilang promising, bilang isang resulta kung saan ang pamamahala ng CompTek (mga benta ng mga computer at mga bahagi) at ang mga developer ng system ay nagpasya sa pagpapayo ng karagdagang pag-unlad ng teknolohiya at ang pagpapakilala nito sa masa. Kaugnay nito, isang konsepto ng pagbuo ng proyekto ang inihanda, na naglalayong malawak na madla.

Ang Yandex ay opisyal na inihayag lamang noong Setyembre 23, 1997. At sa katunayan, sa una ito ay isa sa mga dibisyon ng CompTek International. Ibig sabihin, wala talagang independence doon. At noong 2000 lamang ang Yandex ay naging kumpanya na makikita ngayon. Sa kahulugan na ang kumpanya ay naging ganap na independyente. Malayang Yandex.

Sa pamamagitan ng paraan, matagal bago ang anunsyo ng Yandex search engine, ang kumpanya ay nakabuo ng isang pangalan. Yandex - nangangahulugang "index ng wika". Kung isinalin mula sa Ingles, lumalabas na "Yet Another indexer". Totoo, kung gayon, habang nabuo ang search engine, nagsimulang lumitaw ang iba pang mga interpretasyon. Halimbawa, kung sa English Index ay isinalin mo ang unang titik (I – Z) mula sa English sa Russian, makakakuha ka ng “Yandex”.

Ang pangalan na "Yandex" ay naimbento ni Ilya Segalovich (kasalukuyang direktor ng teknolohiya) at Arkady Volozh

Isang taon bago ang opisyal na paglabas ng kumpanya, noong Oktubre 18, 1996, ginanap ang eksibisyon ng Netcom'96, kung saan ipinakita ng CompTek ang mga unang produkto ng pagbuo ng search engine. Ang mga ito ay Yandex.Site at Yandex.Dict. Pagkatapos, pagkalipas ng anim na buwan, lumitaw ang Yandex.CD - naghahanap ng mga dokumento sa CD ROM, at pagkatapos ay nagsimula ang proyekto ng Yandex.Lib. Ito ay isang Yandex package library, na nilayon para sa pag-embed sa lahat ng uri ng mga application at database.

Sa oras na ang Yandex.ru ay opisyal na ipinakita sa publiko, ang mga sumusunod ay kawili-wili:

    Pagtatasa ng kaugnayan ng mga dokumento. Sa oras na iyon, medyo mahusay ang Yandex sa paghahanap ng mga kopya at hindi kasama ang mga ito. Kasabay nito, ang mga dokumento ay hinanap sa iba't ibang mga pag-encode

    Maghanap ayon sa eksaktong anyo ng salita. Alam ni Yashka kung paano maghanap na isinasaalang-alang ang morpolohiya

    Maghanap batay sa distansya. Maaaring maghanap ang Yandex sa loob ng isang talata gamit ang mga eksaktong parirala

    Ang pangunahing para sa pagtatasa ng kaugnayan ng mga pahina ay gumagana. Para sa bawat kahilingan, pinili ang mga dokumento na isinasaalang-alang ang pagsunod (kaugnayan) sa kahilingan. Bilang karagdagan, kapag pumipili ng mga dokumento para sa mga resulta ng paghahanap, ang dalas (density) ay isinasaalang-alang keyword sa pahina. Sa pamamagitan ng paraan, tiyak na dahil sa di-kasakdalan (sa oras na iyon) ng algorithm na ito, ang mga pahina na puno ng mga keyword, halos walang kahulugan, ay lumitaw sa mga nangungunang resulta ng paghahanap.

    Sa panahon din ng paghahanap, ang distansya sa pagitan ng mga salita at kung paano matatagpuan ang mga salita sa dokumento ay isinasaalang-alang

Disenyo ng website ng Yandex

Ang pinakaunang disenyo para sa website ng Yandex ay medyo primitive at hindi perpekto. Ito ay binuo ng kilalang Artemy Lebedev. Ganito ang itsura niya

Sa pamamagitan ng paraan, binuksan ang forum ng Yandex sa parehong taon. Inilaan para sa komunikasyon sa pagitan ng mga user ng system at mga developer. Maganda ang ideya, at gumana nang normal ang forum. Totoo, umiral ito hanggang 2008. Pagkatapos ay nagkaroon ng bahagyang reshuffling ng mga priyoridad. Sa masasabi ko, ang preference ay ibinigay sa socialization. Nagsimula rin ang Yandex na aktibong bumuo ng sarili nitong social network, sa batayan kung saan lumitaw ang kasalukuyang blog, kung saan ang lahat ng mga anunsyo ng Yandex ay nai-publish, at kung saan, sa katunayan, ang mga gumagamit ay nakikipag-usap sa mga developer. Makikita mo mismo, ang lumang URL ng forum ( http://forum.yandex.ru/yandex/) ngayon ang isang pag-redirect ay alam ng lahat http://webmaster.ya.ru/.

1998

Ang proyekto, na inilunsad, ay nagpakita ng magandang potensyal, at ipinagpatuloy nila ito. Noong 1998, napabuti ang search engine at marami pang iba ang ipinakilala. functionality para sa mga gumagamit. Sa partikular, naging posible na maghanap sa kung ano ang natagpuan, maghanap ng mga katulad na dokumento, at marami pa. Nagpapatuloy din ang trabaho sa disenyo. home page Yandex. Ngayon medyo nagbago na siya

Tulad ng nakikita mo, sa panlabas ay walang gaanong nagbago. Karamihan sa mga teknikal na gawain ay natupad

1999

Sa paglipas ng taon, ang madla ng Russian na bahagi ng Internet ay lumago nang malaki. Kasabay nito, ang kalidad at teknolohiya ng Yandex ay lumago, at ang mga developer ay nagpakilala ng maraming mga pagpapabuti. Ang search engine ng Yandex ay nagpakilala ng isang bagong bot sa paghahanap, na makabuluhang nadagdagan ang bilis ng pag-crawl ng mga dokumento sa network.

Ang mga inobasyon na nakaapekto sa mga bahagi ng user ng functionality ay ang mga sumusunod:

    Posible na ngayong maghanap nang mas partikular - sa pamamagitan ng mga anotasyon, caption, larawan, pamagat

    Ipinakilala namin ang isang paghihigpit sa paghahanap sa isang pangkat ng mga site

    Ang mga dokumento sa Russian ay naka-highlight nang hiwalay

Sa pamamagitan ng paraan, ito ay noong 1999 na ang kilalang konsepto ngayon (thematic citation index) ay unang ipinakilala. Totoo, pagkatapos ay kinakalkula ito nang primitively. Ang awtoridad ng site (aka TIC) ay nakadepende nang malaki sa bilang ng mga site na naka-link sa domain ng interes sa amin.

Ang disenyo ng pangunahing pahina, sa pamamagitan ng paraan, ay nagbago din. Ngayon ito ay naging isang bagay na mas katulad sa kasalukuyan

May isa pang makabuluhang kaganapan noong 1999. Doon siya nagpakita libreng constructor mga site, na mas kilala nating lahat bilang Narod.ru ( libreng pagho-host at pagbabahagi ng file). Sa pamamagitan ng paraan, ang proyektong ito ay umiiral pa rin. Ang motto ng proyektong ito ay: sa loob ng 60 segundo.

2000

Marahil ito ay ang pagpapakilala ng mga bagong serbisyo na nagpapahintulot sa Yandex na maabot ang isang panimula na bagong antas ng pag-unlad. Sa paglipas ng panahon, matatag na itinatag ng search engine ang katayuan nito, na naging posible upang makabuluhang Sa katunayan, ito ay dati na bagong proyekto, hindi ang nagsimula sa ilalim ng pamumuno ng CompTek.

Noong 1999, si Arkady Volozh, na napagtatanto ang mga prospect para sa pagpapaunlad ng proyekto, ay nagsimulang tumuon lamang sa pagtataguyod ng Yandex. Ngunit ang kahirapan ay kinakailangan na makahanap ng mga karanasang kasosyo na may mga kasanayan sa pagtatayo ng kumpanya. Ang tanging kahirapan ay kinakailangan na makahanap ng mga kasosyo na mamumuhunan sa pagbuo ng proyekto, ngunit hindi mangangailangan ng kumpletong paglipat ng pamamahala sa ilalim ng kanilang pamumuno.

At ang gayong kapareha ay natagpuan. Ito ay isang kumpanya ru-Net Holdings. Noong tagsibol ng 2000, isang kasunduan sa pamumuhunan ang natapos sa kumpanyang ito. Dito, gayunpaman, may ilang nasawi. Gayunpaman, kinailangan kong isuko ang isang tiyak na bahagi ng search engine. Ayon sa kasunduan, nakatanggap ang kumpanya ng 1/3 ng search engine. Iyon ay, mula sa sandaling iyon, ang Yandex ay tumigil sa pagiging isang istrukturang dibisyon ng CompTek, ngunit naging isang independiyenteng kumpanya na may sariling mga tanggapan, sariling pamamahala, sariling badyet, atbp. Si Arkady Volozh ay naging pangkalahatang direktor ng kumpanya.

Sa palagay ko, napakaswerte ng Yandex sa unang pinuno nito, dahil si Volozh ay naging hindi lamang isang espesyalista sa paghahanap ng mga potensyal na kasosyo, kundi isang mahusay na innovator. Pagkatapos ng pagsisimula ng independiyenteng "swimming", napakalaking pagbabago ang nagsimula sa kumpanya. Ang mga tauhan ay makabuluhang napunan, at ang mapagkukunan mismo ay nakatanggap ng bagong sipa mula sa mga pinuno nito.

Sa kabuuan, ang ru-Net Holdings ay namuhunan ng humigit-kumulang $5 milyon Ano ang masasabi ko, ang deal ay naging lubhang kumikita, lalo na kung isasaalang-alang ang katotohanan na ngayon ang numero unong search engine sa RuNet ay nagkakahalaga ng hindi bababa sa ilang daang milyong dolyar. Ito ay nasa pinakakonserbatibong pagtatantya.

Ang taong 2000 ay makabuluhan din sa kadahilanang sa taong ito na ang multiportality ng Yandex ay nagsimulang lumitaw nang mas malinaw, dahil maraming mga serbisyo ang nagsimulang lumitaw na hindi direktang nakatali sa paghahanap. Ang mga naturang serbisyo ay Yandex.News, Yandex.Mail, Postcards, at ang search bar sa ya.ru. Bilang karagdagan, mayroong maraming mga serbisyo na kasunod na pinagsama, na naging kilala natin ngayon bilang Yandex.Market. Bilang karagdagan, ang isa pang makabuluhang pagbabago ay ang pagpapakilala ng dalubhasang software para sa pagsasama sa mga browser ng gumagamit - Yandex Bar.

2001

Ang taong ito ay isang punto ng pagbabago, dahil noong 2001 si Yandex ay naging pinuno ng Runet sa mga tuntunin ng trapiko. Bilang karagdagan, ang dami ng impormasyong nakaimbak sa mga server ng kumpanya ay tumaas din. Ang laki nito ay 1 terabyte. Sa pamamagitan ng paraan, ang Yandex.Images ay lumitaw din sa taong ito. Bilang karagdagan, electronic sistema ng pagbabayad Yandex.Money

Bilang karagdagan, ang disenyo ng home page ng Yandex ay higit na napabuti. Narito ang mga link sa mga bagong serbisyo at balita. Masasabi nating sa pangkalahatan ang mga balangkas ng Yandex ngayon ay lumitaw na

2002

Sa taong ito, ang mga developer ay aktibong nagtatrabaho upang mapabuti ang serbisyo ng komunikasyon - Yandex.Mail. Maraming trabaho ang ginawa upang salain ang mga sulat. Ang 2002 ay ang taon ng pagsasama-sama ng tatlong serbisyo - Mga Produkto, Guru at Piliin sa isa - Yandex.Market. Sa pamamagitan ng paraan, makikita mo sa iyong sarili na ang serbisyong ito ay napaka-kaugnay kahit ngayon. Marahil sa unang pagkakataon sa lahat ng mga taon ng pamumuhunan, lumitaw ang isang layunin noong 2002 - upang makamit ang pagiging sapat sa sarili. Kinailangan na bumuo ng isang strategic system para sa pagkakakitaan ng proyekto. Bukod dito, isa na magdadala ng matatag at malaking kita sa hinaharap. Ito ay naging tulad ng isang modelo, at ito ay tiyak na ang kita na nagsimulang matanggap ng kumpanya mula sa modelong ito ng advertising na naging posible upang makamit ang self-sufficiency nang mas maaga kaysa sa inaasahan. Samakatuwid, maaari nating sabihin na ang 2002 ay isang punto ng pagbabago sa mga tuntunin ng pagpasok sa isang modelo na nakatuon sa negosyo, na, bukod dito, ay nagsimula nang magbunga.

2003

Sa taong ito, nagpatuloy ang aktibong gawain sa serbisyo ng Yandex.Mail. Dito, ipinakilala ang mga susunod na malalaking pagbabago, na nakakaapekto sa lahat ng mga gumagamit ng system. Siyempre, naging mas functional at maginhawa ang Ya.Mail. Sa hinaharap, nais kong sabihin na sa hinaharap ang serbisyo ay napakaaktibo din na binuo, at ang mga gumagamit nito ay nakakita ng maraming bagong kawili-wiling mga tampok nang higit sa isang beses. Sa partikular, nakatanggap ang mga user ng walang limitasyong laki ng mailbox at bagong filter ng spam na "Spam Defense." Noong 2003, muling na-update ang disenyo ng Yandex.

Sa pamamagitan ng paraan, ang bawat disenyo ay tumutugma sa isang tiyak na bersyon. Ang 2003 na bersyon ng disenyo ay ang ikawalo sa isang hilera, at ganito ang hitsura

Anumang paglulunsad bagong bersyon ang disenyo ay unang sumasailalim sa isang panahon ng beta testing. At kung bago nito ang mga beta test ay isinagawa sa closed mode, sa pagkakataong ito, sa loob ng dalawang linggo ng pagsubok na pagsubok ng bagong interface, sinuman ay maaaring makakuha ng access sa bagong interface. Totoo, makalipas ang isang taon ang pangunahing isa ay na-upgrade muli, ngunit mas matagumpay. At umiral ito sa form na ito hanggang 2007.

Kahit na sa oras na iyon, ang Yandex ay isang medyo kagalang-galang na kumpanya, dahil noong 2003 ang Yandex search engine ay matagumpay na ipinatupad sa website ng pangulo. Noong taglagas ng 2003, inilunsad ng mga developer ang mga susunod na update sa produkto: Yandex.Publisher, Yandex.Server (Yandex.Server), na naging legacy ng Yandex.Site.

2004

Ang modelo ng negosyo na inookupahan ng numero unong search engine sa RuNet ay gumana nang mahusay, bilang isang resulta kung saan ang kita na natanggap ng kumpanya noong 2004 ay umabot na sa sampu-sampung milyong dolyar. Nagbigay ito ng lakas sa pagbuo ng mga bagong serbisyo, halimbawa, isang serbisyo sa paghahanap sa isang mapa, mga blog, at mga forum. Ang taong 2004 ay kapansin-pansin din sa katotohanan na noon ay lumitaw ang isang seryosong kakumpitensya sa merkado ng Russia sa katauhan ng Google. Nagkaroon ng isang kagyat na pangangailangan na pumasok sa pakikibaka para sa pamumuno, bilang isang resulta kung saan nagpasya ang pamamahala ng Yandex na dagdagan ang mga tauhan nito ng sampung beses. Sa una ay mayroong 200, pagkatapos i-update ang mga tauhan ay mayroong 2,000 empleyado. Ngunit ang pangunahing bagay ay pagkatapos ng pag-renew ng kawani ay walang nagbago para sa mas masahol pa. Nanatili ang mga tradisyon, napapanahon din ang mga teknolohiya. At sa pangkalahatan, masasabi natin na si Yasha ay hindi naging isang tuyong korporasyon.

Labanan ng mga teknolohiya: Yandex vs Google

2005

Lumipas ang taong ito sa ilalim ng slogan ng heograpikal na pagpapalawak ng tanggapan ng kinatawan ng kumpanya. Dahil lumitaw ang Ukrainian representative office ng Yandex - Yandex.Ukraine. Sa pamamagitan ng paraan, ang direktor ng tanggapan ng kinatawan na ito ay si Sergey Petrenko, ang nagtatag ng kilalang paghahanap at ang may-akda ng kawili-wiling blog na BloGnot

Ang taong 2005 ay makabuluhan din dahil nagbukas ang paborito kong isa. Ito ay isang serbisyong batay sa prinsipyo ng "kolotibablo webmaster", at sa Russian, ito ay isang serbisyo na nagpapahintulot sa mga webmaster na maglagay ng advertising sa kanilang mga site.

Sa parehong taon, lumitaw ang Yandex.Dictionaries. Naganap din ang mga pagbabago sa serbisyo ng Yandex.Money. Ngayon ang lahat ng mga gumagamit ay may pagkakataon na pamahalaan ang kanilang account sa pamamagitan ng isang online na pitaka.

2006

Ang taong ito ay maaalala para sa paglitaw ng ngayon kilalang mga blog ng serbisyo.yandex.ru. Ito ay isang uri ng tool sa marketing. Pinahintulutan akong mag-aral ng opinyon ng publiko, mga pagsusuri sa mga blog at forum. Ang Yandex.Maps ay nagpakilala ng isang tool para sa pagpapakita ng mga jam ng trapiko.

Mula 2006 hanggang 2010, ang Yandex ay matatagpuan sa isang lumang opisina sa Samokatnaya Street sa Moscow





As you can see, dati medyo masikip sila. Ito ay hindi ngayon, isang malaking gusali para sa 2000 empleyado.

Noong 2006, nagkaroon ng isa pang kawili-wiling kaganapan - ang unang remote development office ay binuksan sa St. Pagkatapos, siyempre, ang sukat ay hindi pa pareho. Hindi ito tulad ngayon na ang Yandex ay may 11 opisina sa Russia, Ukraine, Turkey at maging sa California. Ang mga opisina ay nag-iiba ayon sa uri ng aktibidad. Mayroong mga tanggapan na kasangkot sa pag-unlad, mga tanggapan ng pagbebenta, mga tanggapan na nagtatrabaho sa lugar ng lokalisasyon ng produkto

2007

Sa taong ito ay may mga kaganapan na mas nakatuon sa mga webmaster. Sa partikular, lumitaw ang serbisyo ng Yandex.Photos. Ngunit para sa akin, bilang isang webmaster, ang isang mas kawili-wiling kaganapan ay ang hitsura ng serbisyo Yandex.Metrica. Totoo, sa oras na iyon ito ay isang ganap na krudo na serbisyo, at hindi ito naglalayong sa mga webmaster, ngunit sa Yandex.Direct na mga advertiser. Sa parehong taon, isang tanggapan ng kinatawan ng Ukrainian ang binuksan - Yandex.ua. Ngayon, ayon sa LiveInternet, halos 14% ng trapiko sa wikang Ruso ay nagmumula sa yandex.ua

Noong 2007 din, isang proyektong kilala ng lahat ng webmaster ang inilunsad, na malamang ay mga tamad lang na tao na hindi gumagamit ngayon.

2008

Masasabi nating sa taong ito ang saklaw ng impluwensya ng Yandex ay tumaas nang husto kaya napagpasyahan na magbukas ng sangay ng search engine sa USA, California. Kasabay nito, ang mga makabuluhang pagdaragdag ay ginawa sa mga algorithm. Sa partikular, nagsimulang suportahan ang mga internasyonal na pamantayan Sitemap, MediaRSS, atbp. Iyon ay, tulad ng nakikita mo, ang mga lugar ng interes ay lumampas sa RuNet. Ang numero unong search engine sa RuNet ay naging mga site sa wikang Ingles. Bago ito, ang problema ay hindi sinusuportahan ng domestic search engine ang mga internasyonal na pamantayan, at samakatuwid ay nagkaroon ng problema sa pag-index ng mga site mula sa burzhunet, ngunit pagkatapos ng pag-upgrade noong 2008, ang problemang ito ay nalutas. At pagkatapos nito, ang logo ng Yandex ay nagsimulang isulat nang buo sa Russian.

2009

Ang taong ito ay makabuluhan dahil bago iyon ay walang dibisyon ng paghahanap ayon sa rehiyon. Iyon ay, bago ang pagpapakilala ng algorithm na ito, ito ay binuo sa mga prinsipyo ng pagkakapareho. Halimbawa, ipinasok mo ang query na "" sa search bar sa Moscow at Novosibirsk, at makakakuha ka ng parehong mga resulta. Ngayon lahat ay nagbago. At ang mga resultang batay sa prinsipyo ng geo-dependence ay inihahalo sa mga resulta ng paghahanap. Sa madaling salita, kung maghahanap ka gamit ang Yandex sa Moscow at Novosibirsk, magkakaiba ang mga resulta.

Noong 2009, nagpatuloy ang trabaho sa dating napiling direksyong kanluran. Sa partikular, sinubukan ang isang serbisyo na ginamit upang isalin ang mga dayuhang site. Pagkatapos ay umunlad ang serbisyong ito, at noong 2011 ay naging kilala ito bilang Yandex.Translation.

Ang isang pantay na mahalagang kaganapan ay ang pagpapakilala ng isang bagong paraan ng pag-aaral ng makina - Matrixnet. Gumagamit ang teknolohiyang ito ng iba't ibang pattern bilang pagtatasa at isinasaalang-alang ang iba't ibang salik sa pagraranggo. Ngunit ang pangunahing bagay ay ang teknolohiya ay self-learning. Kapag sinusuri ang mga tagasuri, ang mga tunay na pattern lamang ang tinatasa, at ang pagtuklas ng mga hindi umiiral ay ganap na hindi kasama.

Ang rebolusyonaryong katangian ng teknolohiyang ito ay nakasalalay sa katotohanan na ang Matrixnet ay gumagamit ng isang hindi kapani-paniwalang kumplikadong formula ng pagraranggo na isinasaalang-alang malaking halaga mga kadahilanan. Ito, sa isang banda, ay nagbibigay-daan sa iyo upang makamit ang mas mahusay na mga resulta ng paghahanap, ngunit sa kabilang banda, hindi nito papayagan ang mga webmaster na maunawaan ang pattern na ito, at, samakatuwid, maimpluwensyahan ito sa kanilang sariling mga interes.

Higit pang mga detalye tungkol sa teknolohiya ng matrixnet:

2010

Ang lumang opisina sa Samokatnaya Street ay isang bagay ng nakaraan, at ang buong kumpanya ay lumipat sa mga bagong mansyon. Sa katunayan, ito ang naging pangunahing kaganapan ng 2010





Hindi kami kasing-katangi-tangi gaya ng iniisip namin: milyon-milyong mga tao na nauna sa amin ang naguguluhan at milyon-milyong kasunod namin ang magpapagulo sa search engine na may halos magkaparehong mga tanong. Sa kabilang banda, kami ay masyadong hindi mahuhulaan: ang pagbabalangkas ng aming kahilingan ay naiimpluwensyahan ng isang malaking bilang ng mga kadahilanan na hindi namin alam. At least para sa kadahilanang ito, ang kahilingan ng bawat isa sa atin, gaano man ito kababawal, ay nangangailangan ng isang indibidwal na diskarte.

Sa katunayan, ang buong gawain ng search engine ng Yandex ay bumaba sa dalawang simpleng bagay: upang maunawaan kung ano ang talagang gustong malaman ng isang tao, at sa ilang segundo upang makahanap ng mga angkop sa mga bilyun-bilyong dokumento sa Internet.

Kumuha ng mga fingerprint

Ang operating system ng search engine ay medyo katulad sa Matrix, at ang search robot (ang kumplikado, nakapag-iisa na programa sa paggawa ng desisyon) ay katulad ng Agent Smith.

Upang hindi maghanap sa buong Internet sa tuwing may kailangang malaman, ang search engine ay gumagawa ng bahagi ng trabaho nang maaga - sinusuri nito kung ano ang nasa Web at kung nasaan ito, gamit ang libu-libong mga robot sa paghahanap. Dumating sila sa dalawang uri: basic at mabilis. Ang pangunahing isa ay gumagapang at nagpoproseso ng Internet sa kabuuan, at ang mabilis - mga dokumento na lumitaw isang minuto o kahit ilang segundo na ang nakalipas. Ang gawain ng mga programa ng robot ay pumili ng angkop at kapaki-pakinabang na impormasyon para sa mga gumagamit, iproseso ito, alisin ang lahat ng hindi napapanahon at hindi kailangan. Sa ilang mga paraan, ito ay nakapagpapaalaala sa pag-uuri ng basura: papel sa isang lalagyan, baso sa isa pa, plastik sa isang pangatlo, basura ng pagkain sa isang ikaapat...

Ang impormasyong nakolekta ng mga robot ay bumubuo sa tinatawag na Internet cast. Ito ay nakaimbak sa libu-libong mga server ng Yandex at patuloy na ina-update. Ang isang nugget ay tulad ng isang listahan na nagsasabi sa iyo kung saan mahahanap kung anong impormasyon. Sa listahang ito, ang bawat keyword ay walang isa, ngunit milyon-milyong "mga pahina". Upang matiyak na ang lahat ng mga update ng nugget ay magagamit sa mga user, inilipat ang mga ito mula sa repositoryo patungo sa "base search". Ang data mula sa pangunahing robot ay inililipat bawat ilang araw, at mula sa mabilis na robot - sa real time.

Dalhin sa malinis na tubig



ILUSTRATION: EVGENY TONKONOGY

Naghahanap ng sagot sa tanong na tanong sa isang handa na base, ang makina ay nahaharap sa dalawang pangunahing paghihirap. Ang unang kahirapan ay ang wika. Bago maghanap ng sagot sa isang tanong, mahalagang maunawaan ng makina kung anong wika ang dapat nitong gawin. Halimbawa, para sa isang taong nagsasalita ng Ruso, ang paghahanap para sa "squad ni Prince Igor" ay makakahanap ng mga dokumento na may impormasyon tungkol sa hukbo, at para sa isang Ukrainian, ang "squad ni Prince Igor" ay magbabalik din ng mga dokumento na nagbabanggit kay Princess Olga, ang kanyang asawa, dahil sa Ukrainian "asawa" ay "squad". At sa mayamang wikang Ruso, ang parehong salita o mga derivatives nito ay maaaring mangahulugan ng iba't ibang bagay. Halimbawa, ang salitang "bakal" ay isa sa mga anyo ng pangngalang "bakal" at ang pandiwa na "maging." Ang pangalawang kahirapan ay ang sikolohiya ng tao. Kapag naglalagay ng kahilingan, inaasahan namin ang isang mabilis at tumpak na sagot, nang hindi natural na nag-aalala tungkol sa kung ang mga salita ng kahilingan ay tumutugma sa mga prinsipyo ng mathematical analysis kung saan gumagana ang utak ng makina. Halimbawa, sa pamamagitan ng pagpasok ng salitang "Napoleon" sa search bar, ano ang gustong makuha ng isang tao: isang recipe ng cake o isang talambuhay ng emperador ng Pransya, bumili ng cognac o hanapin ang address ng isang psychiatric hospital?


Sa ganitong mga sitwasyon, maraming mga teknolohiya ang pumapasok. Maaari kang magbigay sa iyo ng ilang mga pahiwatig sa ilalim ng search bar na tutukuyin ang iyong kahilingan. Tulad ng, piliin kung ano ang kailangan mo: Napoleon recipe o Napoleon - Bonaparte. Kung ang gumagamit ay hindi tumugon sa kahilingan ng makina at hindi nagdagdag ng mga salita sa "Napoleon", kung gayon ang teknolohiyang "Spectrum" ay tumutulong sa bagay na ito: nang hindi umaasa sa tulong, ang makina ay agad na naghahanap ng impormasyon sa ilang mga kategorya (tungkol sa cake, at tungkol sa emperador, at tungkol sa kabayo ..). Bilang karagdagan, ang mga mekanismo ng pag-personalize ay nakakatulong upang maunawaan ang user - ang kaalaman ng makina sa kung ano ang hinahanap ng user na ito sa kanyang computer isang araw, dalawa, tatlo, o buwan na ang nakakaraan: kung madalas kang magtanong sa Yandex tungkol sa pagluluto, ang makina ay unang magpapakita resulta mo na nagsasabing si Napoleon ay isang cake.

Mga kumbinasyon: interes club

Ang gawain ng isang search engine ay hindi lamang pumili ng mga dokumento na naglalaman ng mga salita at parirala mula sa query sa paghahanap. Dapat na maunawaan ng makina kung aling mga dokumento ang nakakatugon sa aming magkasalungat na mga kinakailangan at kung bakit natutugunan ng mga ito ang mga ito. Nais ba naming makakuha ng impormasyon tungkol sa Napoleon the cake, o marahil ay bumisita kami sa isang fitness club na may mapagpanggap na pangalan sa loob ng ilang taon, o kahit na ganap na nag-aalala tungkol sa mga kumplikado ng mga maikling tao. Sa anumang kaso, ang paglutas ng problema ay nangangailangan ng isang di-maliit na diskarte.


Natagpuan ng mga tagalikha ng programa sa paghahanap ng Yandex ang diskarte na ito sa pamamagitan ng pag-delegate ng karapatan sa pagpili sa makina. Sa isang banda, ang isang walang kaluluwa, ngunit napakabilis at matalinong makina ay hindi alam at ayaw malaman ang anumang bagay tungkol sa amin bilang mga indibidwal, at sa kabilang banda, sinusubukan nitong alamin hangga't maaari ang tungkol sa lahat.

Bilang karagdagan sa heyograpikong lokasyon ng user at linguistic analysis ng kanyang mga query, ang search engine ay gumagamit ng ilang libong pamantayan na hindi talaga halata sa mga tao.

Ang lansihin ay ang makina ay bubuo at nag-a-update ng mga pamantayang ito nang nakapag-iisa.

Gumagamit lang ito ng data sa mga kagustuhan at gawi ng gumagamit ng milyun-milyong tao at iniuugnay ang "aritmetika average" na ito sa kasaysayan ng aming mga query. Ang mga prinsipyong gumagabay sa Matrix sa loob mismo, na naghahambing sa libu-libong kategorya ng mga interes ng user na binuo nito, ay kadalasang hindi umaangkop sa mga tradisyonal na ideya ng tao tungkol sa kung ano ang maaaring maging "mga interes" sa prinsipyo. Mayroong sampu-sampung libo sa kanila. Lumilikha sila ng iba't ibang, minsan nakakatawa, mga kumbinasyon sa bawat isa. Halimbawa, ang isa sa mga kumbinasyong ito ay maaaring ang mga resulta ng paghahanap ay tumutugma sa mga interes ng isang taong nag-aanak ng mga bagong panganak. Kasabay nito, ang isang tao ay hindi lamang interesado sa mga newts, ngunit pinalaki na sila, ngunit para lamang sa unang taon.

Mga rating. Pagtulong kamay


Ang matrix, siyempre, ay nagpapasya mismo (sa tulong ng mas mataas na matematika) kung ano at sa anong pagkakasunud-sunod ang kailangang ipakita sa mga gumagamit batay sa sampu-sampung libong pamantayan. Ngunit ang Matrix ay gumagamit din ng mga buhay na tao - 1000 empleyado ng Yandex, ang tinatawag na mga tagasuri, sinusuri ang mga resulta ng paghahanap para sa isang partikular na kahilingan (siyempre, hindi lahat ng kahilingan ay tinasa, at hindi ito ginagawa sa totoong oras) upang makita kung natutugunan nila ang mga inaasahan regular na gumagamit: hindi kasing katwiran ng isang makina, hindi kasing tumpak sa pagbabalangkas, kontradiksyon at emosyonal.

1. Mga tuntunin at kahulugan Sa kasunduang ito sa pagproseso ng personal na data (mula rito ay tinutukoy bilang ang Kasunduan), ang mga tuntunin sa ibaba ay may mga sumusunod na kahulugan: Operator - Indibidwal na Entrepreneur Oleg Aleksandrovich Dneprovsky. Pagtanggap sa Kasunduan - buo at walang kondisyong pagtanggap sa lahat ng mga tuntunin ng Kasunduan sa pamamagitan ng pagpapadala at pagproseso ng personal na data. Personal na data - impormasyong ipinasok ng User (paksa ng personal na data) sa site at direkta o hindi direktang nauugnay sa User na ito. User - sinumang indibidwal o legal na entidad, na matagumpay na nakumpleto ang pamamaraan ng pagpuno sa mga input field sa site. Pagpuno ng mga input field - ang pamamaraan para sa User upang ipadala ang kanilang pangalan, apelyido, numero ng telepono, personal na address email(mula rito ay tinutukoy bilang Personal na Data) sa database ng mga nakarehistrong user ng site, na ginawa para sa layunin ng pagkilala sa User. Bilang resulta ng pagpuno sa mga field ng input, ipinapadala ang personal na data sa database ng Operator. Ang pagpuno sa mga input field ay boluntaryo. website - isang website na matatagpuan sa Internet at binubuo ng isang pahina. 2. Pangkalahatang mga probisyon 2.1. Ang Kasunduang ito ay ginawa batay sa mga kinakailangan Pederal na Batas na may petsang Hulyo 27, 2006 No. 152-FZ "Sa Personal na Data" at ang mga probisyon ng Artikulo 13.11 sa "Paglabag sa Batas Russian Federation sa larangan ng personal na data" ng Code of Administrative Offenses ng Russian Federation at nalalapat sa lahat ng personal na data na maaaring makuha ng Operator tungkol sa User sa panahon ng kanyang paggamit ng Site. 2.2. Ang pagpuno sa mga input field ng User sa Site ay nangangahulugan ng walang kondisyong kasunduan ng User sa lahat ng mga tuntunin ng Kasunduang ito (Pagtanggap sa Kasunduan). Sa kaso ng hindi pagkakasundo sa mga kundisyong ito, hindi pinupunan ng User ang mga input field sa Site. 2.3. Ang pahintulot ng Gumagamit sa pagbibigay ng personal na data sa Operator at ang kanilang pagproseso ng Operator ay may bisa hanggang sa pagwawakas ng mga aktibidad ng Operator o hanggang sa bawiin ng User ang pahintulot. Sa pamamagitan ng pagtanggap sa Kasunduang ito at pagdaan sa pamamaraan ng Pagpaparehistro, pati na rin sa pamamagitan ng pag-access sa Site, kinumpirma ng Gumagamit na, sa pagkilos ng kanyang sariling malayang kalooban at sa kanyang sariling interes, inililipat niya ang kanyang personal na data para sa pagproseso sa Operator at sumasang-ayon na kanilang pagproseso. Inaabisuhan ang Gumagamit na ang pagproseso ng kanyang personal na data ay isasagawa ng Operator batay sa Pederal na Batas ng Hulyo 27, 2006 No. 152-FZ "Sa Personal na Data". 3. Listahan ng personal na data at iba pang impormasyon tungkol sa user na ililipat sa Operator 3.1. Kapag ginagamit ang Website ng Operator, ibinibigay ng User ang sumusunod na personal na data: 3.1.1. Maaasahang personal na impormasyon na ibinibigay ng User tungkol sa kanyang sarili nang nakapag-iisa kapag Pinupunan ang mga input field at/o sa proseso ng paggamit ng mga serbisyo ng Site, kabilang ang apelyido, pangalan, patronymic, numero ng telepono (bahay o mobile), personal na email address. 3.1.2. Ang data na awtomatikong inililipat sa mga serbisyo ng Site sa panahon ng kanilang paggamit gamit ang software na naka-install sa device ng User, kabilang ang IP address, impormasyon mula sa Cookies, impormasyon tungkol sa browser ng User (o iba pang program kung saan ina-access ang mga serbisyo). 3.2. Hindi bini-verify ng Operator ang katumpakan ng personal na data na ibinigay ng User. Sa kasong ito, ipinapalagay ng Operator na ang Gumagamit ay nagbibigay ng maaasahan at sapat na personal na impormasyon sa mga tanong na iminungkahi sa Mga Patlang ng Input. 4. Mga layunin, panuntunan para sa pangongolekta at paggamit ng personal na data 4.1. Pinoproseso ng Operator ang personal na data na kinakailangan upang magbigay ng mga serbisyo at magbigay ng mga serbisyo sa Gumagamit. 4.2. Ang personal na data ng User ay ginagamit ng Operator para sa mga sumusunod na layunin: 4. 2.1. Pagkakakilanlan ng gumagamit; 4.2.2. Ang pagbibigay sa Gumagamit ng mga personalized na serbisyo (pati na rin ang pagpapaalam tungkol sa mga bagong promosyon at serbisyo ng kumpanya sa pamamagitan ng pagpapadala ng mga liham); 4.2.3. Pagpapanatili ng pakikipag-ugnayan sa Gumagamit kung kinakailangan, kabilang ang pagpapadala ng mga abiso, kahilingan at impormasyong nauugnay sa paggamit ng mga serbisyo, pagbibigay ng mga serbisyo, pati na rin ang pagpoproseso ng mga kahilingan at aplikasyon mula sa User; 4.3. Sa panahon ng pagproseso ng personal na data, ang mga sumusunod na aksyon ay isasagawa: pangongolekta, pagtatala, systematization, akumulasyon, imbakan, paglilinaw (pag-update, pagbabago), pagkuha, paggamit, pagharang, pagtanggal, pagkasira. 4.4. Ang gumagamit ay hindi tumututol na ang impormasyong tinukoy niya sa ilang mga kaso ay maaaring ibigay sa mga awtorisadong katawan ng estado ng Russian Federation alinsunod sa kasalukuyang batas ng Russian Federation. 4.5. Ang personal na data ng User ay iniimbak at pinoproseso ng Operator sa paraang ibinigay sa Kasunduang ito para sa buong panahon ng aktibidad ng Operator. 4.6. Ang pagproseso ng personal na data ay isinasagawa ng Operator sa pamamagitan ng pagpapanatili ng mga database, awtomatiko, mekanikal, at manu-manong pamamaraan. 4.7. Gumagamit ang Site ng Cookies at iba pang mga teknolohiya upang subaybayan ang paggamit ng mga serbisyo ng Site. Ang data na ito ay kinakailangan upang ma-optimize ang teknikal na operasyon ng Site at mapabuti ang kalidad ng pagbibigay ng serbisyo. Ang Site ay awtomatikong nagtatala ng impormasyon (kabilang ang URL, IP address, uri ng browser, wika, petsa at oras ng kahilingan) tungkol sa bawat bisita sa Site. Ang gumagamit ay may karapatang tumanggi na magbigay ng personal na data kapag bumibisita sa Site o huwag paganahin ang Cookies, ngunit sa kasong ito, hindi lahat ng mga function ng Site ay maaaring gumana nang tama. 4.8. Ang mga kundisyon ng pagiging kumpidensyal na ibinigay para sa Kasunduang ito ay nalalapat sa lahat ng impormasyon na maaaring makuha ng Operator tungkol sa User sa panahon ng pananatili ng huli sa Site at paggamit ng Site. 4.9. Ang impormasyong ibinunyag sa publiko sa panahon ng pagpapatupad ng Kasunduang ito, gayundin ang impormasyon na maaaring makuha ng mga partido o mga ikatlong partido mula sa mga mapagkukunan kung saan kami ay may access, ay hindi kumpidensyal. libreng pag-access sa sinumang tao. 4.10. Ginagawa ng Operator ang lahat ng kinakailangang hakbang upang maprotektahan ang pagiging kumpidensyal ng personal na data ng User mula sa hindi awtorisadong pag-access, pagbabago, pagsisiwalat o pagkasira, kabilang ang: pagtiyak ng patuloy na panloob na pag-verify ng mga proseso ng pagkolekta, pag-iimbak at pagproseso ng data at pagtiyak ng seguridad; tinitiyak ang pisikal na seguridad ng data, na pumipigil sa hindi awtorisadong pag-access sa mga teknikal na sistema, tinitiyak ang pagpapatakbo ng Site, kung saan ang Operator ay nag-iimbak ng personal na data; nagbibigay ng access sa personal na data lamang sa mga empleyado ng Operator o mga awtorisadong tao na nangangailangan ng impormasyong ito upang maisagawa ang mga tungkuling direktang nauugnay sa pagbibigay ng mga serbisyo sa User, pati na rin ang pagpapatakbo, pag-unlad at pagpapabuti ng Site. 4.11. Tungkol sa personal na data ng User, ang kanilang pagiging kompidensiyal ay pinananatili, maliban sa mga kaso kung saan ang User ay kusang-loob na nagbibigay ng impormasyon tungkol sa kanyang sarili para sa pampublikong access sa walang limitasyong bilang ng mga tao. 4.12. Ang paglipat ng Operator ng personal na data ng Gumagamit ay ligal sa panahon ng muling pag-aayos ng Operator at ang paglipat ng mga karapatan sa ligal na kahalili ng Operator, habang ang lahat ng mga obligasyon na sumunod sa mga tuntunin ng Kasunduang ito na may kaugnayan sa natanggap niya ay inilipat sa legal na kahalili personal na impormasyon. 4.13. Ang Pahayag na ito ay nalalapat lamang sa Website ng Operator. Ang Kumpanya ay hindi kinokontrol at hindi mananagot para sa mga third party na site (mga serbisyo) na maa-access ng user sa pamamagitan ng mga link na available sa Website ng Operator, kasama ang mga resulta ng paghahanap. Sa naturang mga Site (mga serbisyo), ang ibang personal na impormasyon ay maaaring mangolekta o humiling mula sa user, at iba pang mga aksyon ay maaari ding isagawa 5. Mga karapatan ng user bilang paksa ng personal na data, pagbabago at pagtanggal ng personal na data ng user 5.1. Ang gumagamit ay may karapatan: 5.1.2. Atasan ang Operator na linawin ang kanyang personal na data, i-block ito o sirain ito kung ang personal na data ay hindi kumpleto, lipas na sa panahon, hindi tumpak, iligal na nakuha o hindi kinakailangan para sa nakasaad na layunin ng pagproseso, at gumawa din ng mga hakbang na ibinigay ng batas upang maprotektahan ang kanyang mga karapatan. 5.1.3. Tumanggap ng impormasyon tungkol sa pagproseso ng kanyang personal na data, kabilang ang impormasyong naglalaman ng: 5.1.3.1. kumpirmasyon ng katotohanan ng pagproseso ng personal na data ng Operator; 5.1.3.2. ang mga layunin at pamamaraan ng pagproseso ng personal na data na ginagamit ng operator; 5.1.3.3. pangalan at lokasyon ng Operator; 5.1.3.4. naprosesong personal na data na nauugnay sa may-katuturang paksa ng personal na data, ang pinagmulan ng kanilang resibo, maliban kung ang ibang pamamaraan para sa pagtatanghal ng naturang data ay ibinigay ng pederal na batas; 5.1.3.5. mga tuntunin para sa pagproseso ng personal na data, kabilang ang mga panahon ng imbakan; 5.1.3.6. iba pang impormasyon na ibinigay para sa kasalukuyang batas ng Russian Federation. 5.2. Ang pag-withdraw ng pahintulot sa pagproseso ng personal na data ay maaaring isagawa ng User sa pamamagitan ng pagpapadala sa Operator ng naaangkop na nakasulat (naka-print sa isang tangible medium at nilagdaan ng User) na abiso. 6. Mga Responsibilidad ng Operator. Access sa personal na data 6.1. Ang Operator ay nangangako upang matiyak ang pag-iwas sa hindi awtorisado at hindi naka-target na pag-access sa personal na data ng Mga Gumagamit ng Website ng Operator. Sa kasong ito, ang awtorisado at naka-target na pag-access sa personal na data ng Mga User ng Site ay ituturing na access sa kanila ng lahat ng mga interesadong partido, na ipinatupad sa loob ng balangkas ng mga layunin at paksa ng Site ng Operator. Kasabay nito, hindi mananagot ang Operator para sa posibleng hindi naaangkop na paggamit ng personal na data ng Mga User na naganap bilang resulta ng: mga teknikal na problema sa software at sa mga teknikal na paraan at mga network na lampas sa kontrol ng Operator; kaugnay ng sinadya o hindi sinasadyang paggamit ng mga Website ng Operator maliban sa layunin ng mga ikatlong partido; 6.2 Ang Operator ay nagsasagawa ng kinakailangan at sapat na pang-organisasyon at teknikal na mga hakbang upang maprotektahan ang personal na impormasyon ng gumagamit mula sa hindi awtorisado o hindi sinasadyang pag-access, pagkasira, pagbabago, pagharang, pagkopya, pamamahagi, gayundin mula sa iba pang labag sa batas na pagkilos ng mga ikatlong partido. 7. Mga Pagbabago sa Patakaran sa Privacy. Naaangkop na batas 7.1. Ang Operator ay may karapatang gumawa ng mga pagbabago sa Mga Regulasyon na ito nang walang anumang espesyal na abiso sa Mga Gumagamit. Kapag ang mga pagbabago ay ginawa sa kasalukuyang edisyon, ang petsa ay ipinahiwatig huling update

. Ang bagong edisyon ng Mga Regulasyon ay magkakabisa mula sa sandali ng paglalathala nito, maliban kung iba ang ibinigay ng bagong edisyon ng Mga Regulasyon. 7.2. Ang batas ng Russian Federation ay dapat ilapat sa Regulasyon na ito at ang ugnayan sa pagitan ng Gumagamit at Operator na nagmumula na may kaugnayan sa aplikasyon ng Regulasyon.

Tanggap ko hindi ko tinatanggap

Kumusta mahal na mga kaibigan! Sa artikulong ito ay patuloy naming titingnan ang search engine ng Yandex, at habang naaalala mo, sa mga nakaraang artikulo ay tinalakay namin ang kasaysayan ng paglikha ng mahusay na kumpanyang ito, na una sa mga kakumpitensya nito sa Russia at higit pa.

Ang lahat ng ito ay mabuti, ngunit ang mga nagsisimula at may karanasan na mga tagabuo ng site ay interesado sa pinakamahalagang tanong, siyempre, na may kaugnayan sa kung paano dalhin ang kanilang mga proyekto sa mga unang lugar sa TOP na mga resulta ng paghahanap.

Samakatuwid, tingnan natin kung paano gumagana ang search engine ng Yandex upang maunawaan kung anong mga pagkakamali ang maaari mong hakbang, at kung ano ang aasahan mula sa isang search engine ng Russia sa pangkalahatan.

Sa huling artikulo na ating tinalakay. Ang paksa ay naging medyo kawili-wili at kapaki-pakinabang. Samakatuwid, nagpasya akong dagdagan ito, palalimin ito, wika nga.

Kaya, marahil ay medyo nadala ako sa tanong na "Bakit nag-i-index ang isang search engine ng mga dokumento"? Ang natitira na lang ay upang malaman ang tanong na "paano".

Mga algorithm sa pagraranggo ng website

Una, kilalanin natin ang ilang mga algorithm na mahalaga sa anumang search engine:

— Direktang algorithm sa paghahanap.

Para sa algorithm na ito, isang text file ang nilikha mula sa bawat pahina ng iyong blog. Inililista ng file na ito sa alphabetical order ang LAHAT ng mga salitang iyong ginamit. Kahit na ang posisyon ng salitang ito sa teksto ay ipinahiwatig (mga coordinate sa teksto).

Tama na mabilis na paraan, ngunit nangyayari na ang paghahanap nang may ilang error.

Ang pangunahing bagay na dapat maunawaan dito ay ang algorithm na ito ay hindi naghahanap sa Internet, hindi sa pamamagitan ng paghahanap sa isang blog. At sa isang hiwalay text file, na matagal nang nilikha. Nang dumating sa iyo ang robot. At ang mga file na ito (reverse index) ay naka-imbak sa mga server ng Yandex.

Kaya, ito ang mga pangunahing algorithm sa paghahanap. Yung. kung paano lamang nahahanap ng Yandex mga kinakailangang dokumento. Mukhang walang problema dito.

Ngunit alam ng Yandex ang higit sa isa o kahit 100 mga dokumento, ngunit ayon sa pinakabagong data mula sa aking mga mapagkukunan, alam ng Yandex ang tungkol sa 11 bilyong mga dokumento (10,727,736,489 na mga pahina).

At sa lahat ng dami na ito, kailangan mong pumili ng mga dokumento na tumutugma sa kahilingan. At higit sa lahat, kailangan mong i-ranggo sila kahit papaano. Yung. ayusin ayon sa antas ng kahalagahan, o sa halip ayon sa antas ng pagiging kapaki-pakinabang para sa mambabasa.

Mga modelo ng paghahanap sa matematika

Upang malutas ang isyung ito, ang mga modelo ng matematika ay sumagip. Ngayon ay pag-uusapan natin ang tungkol sa pinakasimpleng mga modelo.

Boolean mathematical model– Kung ang isang salita ay lumitaw sa isang dokumento, ang dokumento ay itinuturing na natagpuan. Nagkataon lang at walang kumplikado.

Ngunit may mga problema dito. Halimbawa, kung ikaw, bilang isang gumagamit, ay naglagay ng ilang tanyag na salita, o mas mabuti pa, ang pang-ukol na "v", na siyang pinakakaraniwang salita sa wikang Ruso at matatagpuan sa BAWAT dokumento, bibigyan ka ng napakaraming resulta. na hindi mo man lang namalayan ang ganoong numero, Ilang dokumento ang nakita mo? Samakatuwid, lumitaw ang sumusunod na modelo ng banig.

Vector mathematical model– tinutukoy ng modelong ito ang "bigat" ng dokumento. Hindi lamang nangyayari ang pagkakataon, ngunit ang salita ay dapat mangyari nang maraming beses. Bukod dito, kung mas maraming salita ang lumalabas, mas mataas ang kaugnayan (pagsunod).

Ito ang modelong vector na ginagamit ng LAHAT ng mga search engine.

Probabilistikong modelo- mas kumplikado. Ang prinsipyo ay ito: natagpuan ng search engine ang template ng pahina mismo. Halimbawa, naghahanap ka ng impormasyon tungkol sa kasaysayan ng Yandex. Ang Yandex ay nag-iimbak ng ilang uri ng pamantayan, sabihin nating ito ang aking naunang artikulo tungkol sa Yandex.

At ihahambing niya ang lahat ng iba pang mga dokumento sa artikulong ito. At ang lohika dito ay ito: mas katulad ng iyong pahina ng blog sa aking artikulo, mas malamang na ang iyong pahina ng blog ay magiging kapaki-pakinabang din sa mambabasa at nagsasabi rin tungkol sa kasaysayan ng Yandex.

Upang bawasan ang bilang ng mga dokumento na kailangang ipakita sa gumagamit, ipinakilala ang konsepto ng kaugnayan, i.e. pagsunod.

Gaano nauugnay ang iyong pahina ng blog sa paksa? Ito ay isang mahalagang paksa pagdating sa kalidad ng paghahanap.

Mga Tagasuri - sino sila at ano ang kanilang pananagutan?

Ang kaugnayan na ito ay kailangan din upang masuri ang kalidad ng mga algorithm.

Para sa layuning ito mayroong isang punong-tanggapan ng mga espesyal na pwersa - sila ay tinatawag na Assessors. Ito ay mga espesyal na tao na tumitingin sa mga resulta ng paghahanap gamit ang kanilang mga kamay.

Mayroon silang mga tagubilin kung paano suriin ang mga site, kung paano suriin, atbp. At manu-mano nilang tinutukoy kung ang iyong mga pahina ay angkop para sa mga query sa paghahanap o hindi.

At ang kalidad ng mga algorithm sa paghahanap ay nakasalalay sa opinyon ng mga tagasuri. Kung sasabihin ng lahat ng mga tagasuri na ang mga resulta ng paghahanap ay hindi tumutugma sa mga query, nangangahulugan ito na ang algorithm ng pagraranggo ay hindi tama at ang Yandex lamang ang dapat sisihin.

Kung sasabihin ng mga tagasuri na isang site lamang ang hindi nakakatugon sa kahilingan, nangangahulugan ito na lumilipad ang site sa isang lugar na malayo at ibinaba sa mga resulta ng paghahanap. Mas tiyak, hindi ang buong site, ngunit isang artikulo lamang, ngunit ito ay "hindi ang punto."

Siyempre, hindi maaaring suriin at suriin ng mga tagasuri ang LAHAT ng mga artikulo gamit ang kanilang mga kamay at mata. Ito ay naiintindihan.

At iba pang mga parameter kung saan niraranggo ang mga pahina ay dumating sa pagsagip.

Mayroong marami sa kanila, halimbawa:

  • bigat ng pahina (vIC, PageRank, baby bumps Lahat sa lahat);
  • awtoridad ng domain;
  • kaugnayan ng teksto sa kahilingan;
  • kaugnayan ng mga tekstong panlabas na link sa query;
  • pati na rin ang maraming iba pang mga kadahilanan sa pagraranggo.

Ang mga tagasuri ay gumagawa ng mga komento, at ang mga taong responsable sa pag-set up modelo ng matematika ranggo, sa turn, i-edit ang formula, bilang isang resulta kung saan ang search engine ay gumagana nang mas mahusay.

Ang pangunahing pamantayan para sa pagsusuri ng pagganap ng formula:

1. Katumpakan ng mga resulta ng search engine- porsyento ng mga dokumento na tumutugma sa kahilingan (may kaugnayan). Yung. Ang mas kaunting mga pahina na hindi tumutugma sa kahilingan, mas mabuti.

2. Pagkumpleto ng mga resulta ng search engine ay ang ratio ng mga nauugnay na web page ayon sa ang kahilingang ito sa kabuuang bilang ng mga nauugnay na dokumento sa koleksyon (ang kabuuan ng mga pahina na matatagpuan sa search engine).

Halimbawa, kung mayroong mas may-katuturang mga pahina sa buong koleksyon kaysa sa resulta ng paghahanap, pagkatapos ay nangangahulugan ito na ang output ay hindi kumpleto. Nangyari ito dahil na-filter ang ilan sa mga nauugnay na web page.

3. Kaugnayan ng mga resulta ng search engine- ito ay ang pagsunod ng web page sa kung ano ang nakasulat sa snippet. Halimbawa, ang isang dokumento ay maaaring ibang-iba o wala talaga, ngunit naroroon pa rin sa mga resulta ng paghahanap.

Ang kaugnayan ng mga resulta ng paghahanap ay direktang nakasalalay sa kung gaano kadalas ini-scan ng search robot ang mga dokumento mula sa koleksyon nito.

Ang koleksyon ng koleksyon (pag-index ng mga pahina ng site) ay isinasagawa espesyal na programa- robot sa paghahanap.

Ang search robot ay tumatanggap ng isang listahan ng mga address para sa pag-index, kinokopya ang mga ito, at pagkatapos ay ipinapadala ang mga nilalaman ng mga kinopyang web page para sa pagproseso sa isang algorithm na nagko-convert sa kanila sa mga reverse index.

Buweno, "sa maikling salita," upang magsalita, tinalakay namin ang mga prinsipyo ng search engine.

Ibuod natin:

  1. Dumating ang isang search robot sa iyong blog.
  2. Iniimbak ng search robot ang reverse index ng page para sa mga susunod na paghahanap.
  3. Gamit ang isang mathematical model, ang dokumento ay pinoproseso at ipinapakita sa mga resulta ng paghahanap gamit ang mga formula at isinasaalang-alang ang opinyon ng assessor.

Ito ay napaka, napakasimple. Para lamang makakuha ng pangunahing pag-unawa sa kung paano gumagana ang Yandex search engine.

Nakasulat na ako ngayon ng napakaraming teksto, at marahil napakaraming hindi malinaw. Samakatuwid, iminumungkahi kong bumalik ka sa artikulong ito sa ibang pagkakataon at panoorin ang video na ito.

Ito ay isang mahusay na gabay, na natutunan ko rin mula sa isang pagkakataon.

pag-asa ibinigay na impormasyon ay tutulong sa iyo na mas maunawaan kung bakit ang isa sa iyong mga site ay sumasakop sa mga may-katuturang posisyon sa mga paghahanap at gawin ang lahat upang mapabuti ang mga ito.

Sa pamamagitan nito, paalam ko sa iyo, kung mayroon kang anumang mga katanungan, lagi akong masaya na sagutin ang mga ito sa mga komento. O baka gusto mong idagdag sa artikulo?

Sa anumang kaso, ipahayag ang iyong opinyon. !