집 계정 Yandex 검색 엔진의 작동 원리에 대한 가장 간단한 설명입니다. Yandex 검색 엔진의 추정 작동 방식. 돕는 손

Yandex 검색 엔진의 작동 원리에 대한 가장 간단한 설명입니다. Yandex 검색 엔진의 추정 작동 방식. 돕는 손

이 기사에서는 Yandex 검색 엔진이 무엇인지, 그리고 이것이 어떻게 작동하는지에 대해 설명하겠습니다. 검색 엔진 Yandex 검색 엔진이 순위를 제한하는 사이트의 예를 제시하겠습니다.

Yandex 검색 엔진의 인기 순위는 세계 20위, 러시아에서는 1위입니다. 공식적으로 Yandex 회사는 1997년 9월 23일에 승인되었으며 Comp Tek International 회사의 틀 내에서 개발이 시작되었으며 이미 2000년에 Yandex가 별도 회사로 존재하기 시작했습니다.

회사의 창립자는 총괄 이사인 Volozh Arkady Yurievich와 Yandex의 창립자이자 기술 및 개발 이사인 Segalovich Ilya Valentinovich(1964-2013)입니다. 우리는 Yandex의 역사에 대해 조금 배웠습니다. 이제 검색 엔진에 대해 이야기해 보겠습니다.

따라서 Yandex 회사의 주요 방향은 검색 엔진입니다. 독특한 특징이는 검색어를 미세 조정하는 것입니다. Yandex 검색 엔진을 사용하면 형태학적 철자를 고려하여 러시아어, 우크라이나어, 벨로루시어, 타타르어, 카자흐어, 영어, 터키어, 독일어 및 프랑스어로 선택한 검색어를 검색할 수 있습니다.

Yandex는 또한 관련성을 평가하기 위한 철저한 알고리즘과 다양한 인코딩의 사본을 제외하고 문서를 확인하는 원칙을 개발했습니다. Google과 달리 더 정확하게는 PR 순위 알고리즘인 PageRank를 사용합니다. 중요한 점 Yandex 검색 엔진의 경우 주제별 인용 색인인 TIC가 도입되었습니다.

Yandex 검색 엔진의 작업

http://www.yandex.ru
Yandex 검색 엔진에는 사이트의 관련성을 확인하는 특정 프로그램인 로봇이 있습니다. 검색 로봇은 직접 링크를 통해 사이트로 이동하여 새 페이지를 색인화하고 데이터베이스에 저장합니다. 색인된 웹사이트 페이지가 매우 중요한 TOP에 도달하려면 페이지의 키워드 빈도, 페이지 수, 검색어 수 등 색인 측면을 고려해야 합니다. 외부 링크귀하의 사이트로 이어지는 사이트의 전체 가중치는 Yandex TIC와 같은 지표로 측정됩니다.

Yandex 시스템이 순위를 제한하는 사이트의 예

다른 사이트에서 복사하거나 다시 작성한 고유하지 않은 콘텐츠가 포함된 사이트입니다.

그룹 단위로 서로 집중적으로 연결되어 있는 사이트입니다.

의미없는 내용을 담고 있는 사이트.

사기성 기술을 사용하는 사이트.

링크 스팸이 많이 포함된 포럼 및 게시판.

작성자가 자신의 리소스를 방문하도록 초대하지 않은 외부 링크를 배치하여 관련성을 얻으려는 사이트입니다.

오늘 우리는 검색 엔진 개발의 화려한 경로를 따라 또 다른 긴 여행을 시작했습니다. 얀덱스, 얀덱스). 나는 국내 온라인 검색의 거대 기업이 모든 구석 구석을 파헤치는 것이 너무 게으르지 않을 정도로 오래 전부터 성장했다고 생각하며 Yandex 검색 엔진이 어떻게 발전했는지, 그리고 수년 동안 흥미로웠던 것이 무엇인지 기억합니다. 존재.

또한 Yandex 검색 엔진을 통해 많은 방문자가 방문하고 있습니다. 그들 중 다수는 문맥 광고를 통해 떠나고, 최근에 제가 블로그를 인수했기 때문에 이 회사는 이에 대해 큰 출판물을 쓸 가치가 충분하다고 생각합니다.

러시아 인터넷을 고려하면 Yandex가 확실한 리더입니다. 러시아에서는 최초의 가장 중요한 검색 엔진입니다. 벨로루시, 우크라이나, 카자흐스탄에는 지역 검색 엔진, 일종의 지점이 있습니다. Yandex는 이들 국가의 주민들에게 매우 인기가 있습니다. 다른 지역에서도 많은 방문객이 찾아오는 것을 보면 적어도 통계로 판단할 수 있습니다.

현재 Yandex는 검색 엔진일 뿐만 아니라 이 검색 엔진의 모든 사용자가 액세스할 수 있는 수많은 서비스이기도 합니다. 여기서 당신은 찾을 수 있습니다 필요한 정보, 선택한 여가 활동 탐색, 사진, 제품 찾기, 가격 비교, 날씨 확인, 소셜 네트워크에서 소통, TV 시청 및 교통 일정 등을 살펴보세요. 수많은 엔터프라이즈 솔루션이 있습니다. Narod.ru로 이동할 수도 있습니다. Yandex는 귀하의 웹사이트 작업에 필요한 기능을 제공하는 편리한 시스템을 갖추고 있습니다. 사용 가능한 최신 서비스 혁신 중에는 꽤 오랫동안 유료로 유지되었지만 2011년 12월에 이 서비스는 모든 사람이 사용할 수 있게 되었습니다.

저는 Yandex의 놀라운 기술과 유용한 서비스에 대해 아주 오랫동안 계속해서 이야기할 수 있었습니다. 따라서 정보를 쉽게 인식할 수 있도록 여정을 구성 요소로 나누겠습니다. 검색 엔진의 전체 경로를 생성부터 현재까지 연도순으로 설명하겠습니다.

Yandex 개발의 역사

1980년대 - 1990년대

Yandex 개발의 역사그 뿌리는 소련 시절인 80년대로 거슬러 올라갑니다. Arcadia에서 검색 소프트웨어 개발이 처음 시작된 것은 바로 그때였습니다. 이 작업은 Arkady Borkovsky와 Arkady Volozh의 지도력하에 수행되었습니다. 그게 첫 번째야 검색 기술"Yandex"라는 이름을 받았습니다. 그리고 오늘날 우리가 볼 수 있는 Yandex 웹사이트 자체는 1996년에 등장했습니다. 당시 수행된 개발은 유망한 것으로 인식되었으며 그 결과 CompTek 경영진(컴퓨터 및 부품 판매)과 시스템 개발자는 기술의 추가 개발 및 대중 소개의 타당성을 결정했습니다. . 이와 관련하여 광범위한 청중을 대상으로 한 프로젝트 개발 컨셉이 준비되었습니다.

Yandex는 1997년 9월 23일에야 공식적으로 발표되었습니다. 사실 처음에는 CompTek International의 부서 중 하나였습니다. 즉, 거기에는 전혀 독립이 없었습니다. 그리고 2000년에야 Yandex가 오늘날 볼 수 있는 회사가 되었습니다. 회사가 이미 완전히 독립했다는 의미에서요. 독립 Yandex.

그건 그렇고, Yandex 검색 엔진이 발표되기 오래 전에 회사는 이름을 내놓았습니다. Yandex – "언어 색인"을 의미합니다. 영어로 번역하면 "Yet Another indexer"가 됩니다. 사실, 검색 엔진이 발전하면서 다른 해석도 나타나기 시작했습니다. 예를 들어, 영어 색인에서 영어의 첫 글자(I – Z)를 러시아어로 번역하면 "Yandex"가 표시됩니다.

"Yandex"라는 이름은 Ilya Segalovich(현 기술 이사)와 Arkady Volozh가 발명했습니다.

회사가 공식 출시되기 1년 전인 1996년 10월 18일 Netcom'96 전시회가 열렸으며, 여기서 CompTek은 개발 중인 검색 엔진의 첫 번째 제품을 선보였습니다. 이들은 Yandex.Site 및 Yandex.Dict였습니다. 그런 다음 6개월 후 Yandex.CD가 나타났습니다. CD ROM에서 문서를 검색한 후 Yandex.Lib 프로젝트가 시작되었습니다. 모든 종류의 애플리케이션과 데이터베이스에 삽입하기 위한 Yandex 패키지 라이브러리였습니다.

Yandex.ru가 공식적으로 대중에게 공개되었을 때 다음과 같은 내용이 흥미로웠습니다.

문서의 관련성을 평가합니다. 당시 Yandex는 사본을 찾아 제외하는 데 꽤 능숙했습니다. 동시에 다양한 인코딩으로 문서가 검색되었습니다.

정확한 단어 형식으로 검색하세요. Yashka는 형태를 고려하여 검색하는 방법을 알고 있었습니다.

거리를 기준으로 검색합니다. Yandex는 정확한 문구를 사용하여 단락 내에서 검색할 수 있습니다.

페이지의 관련성을 평가하는 핵심이 작동하고 있었습니다. 각 요청에 대해 요청에 대한 준수(관련성)를 고려하여 문서가 선택되었습니다. 또한, 검색 결과를 위한 문서 선정 시 빈도(밀도)를 고려하였습니다. 예어페이지에서. 그건 그렇고, (당시) 이 알고리즘의 불완전성으로 인해 사실상 의미가 없는 키워드로 빽빽하게 채워진 페이지가 상위 검색 결과에 나타났습니다.

또한 검색 시 단어 사이의 거리와 문서 내 단어의 위치를 고려했습니다.

Yandex 웹사이트 디자인

Yandex 웹사이트의 첫 번째 디자인은 매우 원시적이고 불완전했습니다. 그것은 잘 알려진 Artemy Lebedev에 의해 개발되었습니다. 그는 이렇게 생겼어요

그건 그렇고, Yandex 포럼은 같은 해에 열렸습니다. 시스템 사용자와 개발자 간의 통신을 위한 것입니다. 아이디어는 좋았고 포럼은 정상적으로 작동했습니다. 사실, 2008년까지 존재했습니다. 그런 다음 우선순위가 약간 변경되었습니다. 내가 아는 한, 사회화를 선호했습니다. Yandex는 또한 자체 개발을 적극적으로 시작했습니다. 소셜 네트워크, 현재 블로그가 등장하고 모든 Yandex 공지가 게시되며 실제로 사용자가 개발자와 통신하는 곳을 기반으로 합니다. 이전 포럼 URL( http://forum.yandex.ru/yandex/) 오늘 리디렉션은 모든 사람에게 알려져 있습니다. http://webmaster.ya.ru/.

1998년

시작된 프로젝트는 좋은 잠재력을 보였으며 계속해서 작업했습니다. 1998년에는 검색 엔진이 개선되었고 다른 많은 것들이 도입되었습니다. 기능성사용자를 위해. 특히, 발견된 내용에 대한 검색, 유사한 문서 검색 등이 가능해졌습니다. 디자인 작업도 진행 중이다. 홈페이지 Yandex. 이제 그녀는 조금 변했어요

보시다시피 겉으로는 크게 변한 것이 없습니다. 대부분의 기술 작업이 수행되었습니다.

1999년

지난 한 해 동안 러시아의 인터넷 점유율이 크게 증가했습니다. 이와 함께 Yandex의 품질과 기술도 향상되었으며 개발자들은 많은 개선 사항을 도입했습니다. Yandex 검색 엔진은 새로운 검색 봇을 도입하여 네트워크에서 문서 크롤링 속도를 크게 높였습니다.

기능의 사용자 부분에 영향을 미치는 혁신은 다음과 같습니다.

이제 주석, 캡션, 사진, 제목을 기준으로 보다 구체적으로 검색할 수 있습니다.

사이트 그룹에 대한 검색 제한을 도입했습니다.

러시아어로 된 문서는 별도로 강조 표시되었습니다.

그런데 현재 잘 알려진 개념(주제별 인용지수)이 처음으로 소개된 것은 1999년이었습니다. 사실, 그것은 아주 원시적으로 계산되었습니다. 사이트(TIC라고도 함)의 권한은 우리가 관심 있는 도메인에 연결된 사이트의 수에 크게 좌우됩니다.

그런데 메인 페이지의 디자인도 변경되었습니다. 이제는 현재와 더 비슷한 것이되었습니다.

1999년에는 또 다른 중요한 사건이 있었습니다. 그 때 그 사람이 나타났어요. 무료 생성자우리 모두에게 Narod.ru로 더 잘 알려진 사이트( 무료 호스팅및 파일 공유). 그런데 이 프로젝트는 아직도 존재합니다. 이번 프로젝트의 모토는 '60초 안에'였습니다.

2000

아마도 Yandex가 근본적으로 새로운 수준의 개발에 도달할 수 있었던 것은 새로운 서비스의 도입이었을 것입니다. 시간이 지남에 따라 검색 엔진은 확고한 지위를 확립하여 상당한 성과를 거두었습니다. 사실은 이미 그랬어 새 프로젝트, CompTek의 후원으로 시작된 것이 아닙니다.

1999년에 프로젝트 개발 전망을 깨달은 Arkady Volozh는 Yandex 홍보에만 집중하기 시작했습니다. 하지만 어려움은 기업의 구축 능력을 갖춘 경험 많은 파트너를 찾는 것이 필요하다는 것이었습니다. 유일한 어려움은 프로젝트 개발에 투자할 파트너를 찾는 것이 필요했지만 그들의 리더십 하에 완전한 경영권 이전이 필요하지 않다는 점이었습니다.

그리고 그러한 파트너가 발견되었습니다. 회사였어요 루넷 홀딩스. 2000년 봄에 이 회사와 투자계약을 체결했습니다. 그러나 여기에는 일부 사상자가 발생했습니다. 그래도 검색 엔진의 일정 부분을 포기해야 했습니다. 계약에 따라 회사는 검색 엔진의 1/3을 받았습니다. 즉, 그 순간부터 Yandex는 CompTek의 구조적 부서가 아니라 자체 사무실, 자체 관리, 자체 예산 등을 갖춘 독립 회사가 되었습니다. Arkady Volozh가 회사의 총책임자가되었습니다.

Volozh는 잠재적인 파트너를 찾는 전문가일 뿐만 아니라 훌륭한 혁신가이기 때문에 Yandex는 첫 번째 리더와 함께 매우 운이 좋았다고 생각합니다. 독립 "수영"이 시작된 후 회사에는 엄청난 변화가 시작되었습니다. 직원이 크게 보충되었고 자원 자체가 리더로부터 새로운 활력을 얻었습니다.

전체적으로 ru-Net Holdings는 약 500만 달러를 투자했습니다. 특히 오늘날 RuNet의 1위 검색 엔진이 최소 수억 달러의 비용이 든다는 점을 고려하면 이 거래는 매우 수익성이 높은 것으로 나타났습니다. 이는 가장 보수적으로 추정한 수치입니다.

2000년은 검색과 직접적으로 연결되지 않은 많은 서비스가 등장하기 시작하면서 Yandex의 다포털성이 더욱 분명하게 나타나기 시작한 해라는 점에서 의미 있는 해이기도 합니다. 이러한 서비스는 Yandex.News, Yandex.Mail, 엽서 및 ya.ru의 검색 창이었습니다. 또한 이후에 많은 서비스가 합병되어 오늘날 Yandex.Market으로 알려져 있습니다. 또한 또 다른 중요한 혁신은 사용자 브라우저에 통합하기 위한 특수 소프트웨어인 Yandex Bar를 도입한 것입니다.

2001년

2001년 Yandex가 트래픽 측면에서 Runet의 리더가 되었기 때문에 올해는 전환점이 되었습니다. 또한 회사 서버에 저장되는 정보의 양도 늘어났습니다. 크기는 1테라바이트였다. 그런데 올해 Yandex.Images도 등장했습니다. 게다가 전자 결제 시스템 Yandex.Money

또한 Yandex 홈페이지 디자인이 더욱 대폭 개선되었습니다. 다음은 새로운 서비스와 뉴스에 대한 링크입니다. 일반적으로 오늘날 Yandex의 개요가 이미 나타났습니다.

2002년

올해 개발자들은 통신 서비스인 Yandex.Mail을 개선하기 위해 적극적으로 노력해 왔습니다. 서신을 필터링하기 위해 많은 작업이 수행되었습니다. 2002년은 Products, Guru 및 Select의 세 가지 서비스가 Yandex.Market으로 통합된 해였습니다. 그건 그렇고, 이 서비스가 오늘날에도 매우 관련성이 있다는 것을 직접 확인할 수 있습니다. 아마도 수년간의 투자 중 처음으로 2002년에 자급자족을 달성하겠다는 목표가 나타났을 것입니다. 프로젝트를 수익화하기 위한 전략 시스템을 개발하는 것이 필요했습니다. 더욱이, 미래에 안정적이고 큰 이익을 가져올 것입니다. 그런 모델이 되었고, 예상보다 훨씬 빨리 자급자족을 달성할 수 있게 된 것은 바로 이 광고 모델을 통해 회사가 받기 시작한 수입이었습니다. 따라서 2002년은 비즈니스 중심 모델로 진입하는 전환점이었으며, 더욱이 이미 결실을 맺기 시작한 해라고 할 수 있습니다.

2003년

올해도 Yandex.Mail 서비스에 대한 활발한 작업이 계속되었습니다. 여기에 시스템의 모든 사용자에게 영향을 미치는 다음 대규모 변경 사항이 도입되었습니다. 물론 Ya.Mail은 더욱 기능적이고 편리해졌습니다. 앞으로는 서비스도 매우 활발하게 발전했으며 사용자는 새로운 흥미로운 기능을 여러 번 보았습니다. 특히 사용자는 무제한 메일함 크기와 새로운 "스팸 방어" 스팸 필터를 받았습니다. 2003년에 Yandex의 디자인이 다시 업데이트되었습니다.

그건 그렇고, 각 디자인은 특정 버전에 해당합니다. 2003년 버전의 디자인은 연속 8번째였으며 다음과 같았습니다.

모든 출시 새 버전디자인은 처음에 베타 테스트 기간을 거칩니다. 그리고 이전에 베타 테스트가 비공개 모드에서 수행되었다면 이번에는 2주간의 새 인터페이스 시험 테스트 기간 동안 누구나 새 인터페이스에 액세스할 수 있었습니다. 사실, 1년 후 메인 버전이 다시 업그레이드되었지만 더 성공적이었습니다. 그리고 2007년까지 이런 형태로 존재했습니다.

그 당시에도 Yandex는 이미 상당히 평판이 좋은 회사였습니다. 이미 2003년에 Yandex 검색 엔진이 대통령 웹사이트에 성공적으로 구현되었기 때문입니다. 2003년 가을, 개발자들은 Yandex.Site의 유산이 된 Yandex.Publisher, Yandex.Server(Yandex.Server)라는 다음 제품 업데이트를 출시했습니다.

2004년

RuNet의 1위 검색 엔진이 차지한 비즈니스 모델은 매우 잘 작동했으며 그 결과 2004년에 회사가 얻은 이익은 이미 수천만 달러에 달했습니다. 이는 지도 검색 서비스, 블로그, 포럼 등 새로운 서비스 개발에 박차를 가했습니다. 2004년은 Google이라는 이름으로 러시아 시장에 심각한 경쟁자가 등장한 해이기도 합니다. 리더십을 위한 투쟁이 시급히 필요했고 그 결과 Yandex 경영진은 직원을 10배로 늘리기로 결정했습니다. 처음에는 200명이었는데, 직원을 개편한 후에는 2,000명이 되었습니다. 그러나 가장 중요한 것은 직원 교체 후에도 더 나빠진 것이 없다는 것입니다. 전통은 그대로 유지되었고 기술도 최신이었습니다. 그리고 일반적으로 Yasha는 건전한 기업으로 변하지 않았다고 말할 수 있습니다.

기술 전쟁: Yandex 대 Google

2005년

올해는 회사 대표 사무소의 지리적 확장이라는 슬로건 아래 지나갔습니다. Yandex의 우크라이나 대표 사무소가 등장했기 때문에-Yandex.Ukraine. 그건 그렇고, 이 대표 사무소의 이사는 잘 알려진 검색의 창시자이자 흥미로운 블로그 BloGnot의 저자인 Sergey Petrenko입니다.

2005년은 제가 가장 좋아하는 해가 열렸던 해이기도 합니다. 이는 "kolotibablo 웹마스터" 원칙에 기반한 서비스이며, 러시아어에서는 웹마스터가 자신의 사이트에 광고를 게재할 수 있도록 하는 서비스입니다.

같은 해 Yandex.Dictionaries가 등장했습니다. Yandex.Money 서비스에도 변경 사항이 발생했습니다. 이제 모든 사용자는 온라인 지갑을 통해 자신의 계정을 관리할 수 있습니다.

2006년

올해는 현재 잘 알려진 서비스인 blogs.yandex.ru의 출현으로 기억될 것입니다. 이것은 일종의 마케팅 도구이다. 여론, 블로그 및 포럼에 대한 리뷰를 연구할 수 있게 되었습니다. Yandex.Maps는 교통 체증을 표시하는 도구를 도입했습니다.

2006년부터 2010년까지 Yandex는 모스크바 Samokatnaya Street의 오래된 사무실에 있었습니다.

보시다시피 이전에는 약간 비좁았습니다. 이곳은 지금은 아니고 직원 2000명을 수용할 수 있는 거대한 건물이다.

2006년에는 또 다른 흥미로운 이벤트가 있었습니다. 최초의 원격 개발 사무소가 상트페테르부르크에 문을 열었습니다. 물론 규모는 아직 동일하지 않았습니다. 이것은 오늘날과는 다릅니다. Yandex는 러시아, 우크라이나, 터키, 심지어 캘리포니아에도 11개의 사무실을 두고 있습니다. 사무실은 활동 유형에 따라 다릅니다. 개발 관련 사무소, 영업 사무소, 제품 현지화 업무를 담당하는 사무소가 있습니다.

2007년

올해에는 웹마스터에 더욱 초점을 맞춘 이벤트가 있었습니다. 특히 Yandex.Photos 서비스가 등장했습니다. 하지만 웹마스터인 나에게 있어 더욱 흥미로운 사건은 서비스의 등장이다. Yandex.Metrica. 사실, 그 당시에는 완전히 조잡한 서비스였으며 웹마스터를 대상으로 한 것이 아니라 Yandex.Direct 광고주를 대상으로 했습니다. 같은 해 Yandex.ua라는 우크라이나 대표 사무소가 개설되었습니다. LiveInternet에 따르면 오늘날 러시아어 트래픽의 거의 14%가 yandex.ua에서 발생합니다.

또한 2007년에는 모든 웹마스터에게 알려진 프로젝트가 시작되었는데, 아마도 지금은 사용하지 않는 게으른 사람들일 것입니다.

2008년

올해 Yandex의 영향력 영역이 너무 커져서 미국 캘리포니아에 검색 엔진 지점을 개설하기로 결정했다고 말할 수 있습니다. 동시에 알고리즘에도 중요한 추가 사항이 적용되었습니다. 특히, 국제 표준인 Sitemap, MediaRSS 등이 지원되기 시작했습니다. 즉, 보시다시피 관심 분야가 RuNet을 훨씬 넘어섰습니다. RuNet의 최고의 검색 엔진은 이제 영어 사이트가 되었습니다. 이전에는 국내 검색엔진이 국제 표준을 지원하지 않아 버즈넷에서 사이트를 색인화하는 데 문제가 있었지만 2008년 업그레이드 이후 이 문제는 해결됐다. 그 후 Yandex 로고는 완전히 러시아어로 작성되기 시작했습니다.

2009년

올해는 이전에는 지역별 검색 구분이 없었기 때문에 의미가 깊었습니다. 즉, 이 알고리즘이 도입되기 전에는 균일성의 원칙을 바탕으로 구축되었습니다. 예를 들어 모스크바와 노보시비르스크의 검색창에 ""라는 검색어를 입력하면 동일한 결과가 나타납니다. 이제 모든 것이 바뀌었습니다. 그리고 지리적 의존성의 원리에 기초한 결과가 검색 결과에 혼합됩니다. 간단히 말해서 모스크바와 노보시비르스크에서 Yandex를 사용하여 검색하면 결과가 달라집니다.

2009년에는 이전에 선택한 서쪽 방향으로 작업이 계속되었습니다. 특히, 외국 사이트를 번역하는 데 사용되는 서비스를 테스트했습니다. 그러다가 이 서비스는 진화하여 2011년에 Yandex.Translation으로 알려지게 되었습니다.

마찬가지로 중요한 이벤트는 새로운 기계 학습 방법의 도입이었습니다. 매트릭스넷. 이 기술은 다양한 패턴을 평가로 사용하고 다양한 순위 요소를 고려합니다. 그러나 가장 중요한 것은 기술이 스스로 학습된다는 것입니다. 평가자를 평가할 때 실제 패턴만 평가하고 존재하지 않는 패턴의 발견은 완전히 배제합니다.

이 기술의 혁명적인 성격은 Matrixnet이 다음을 고려하여 엄청나게 복잡한 순위 공식을 사용한다는 사실에 있습니다. 엄청난 양요인. 이는 한편으로는 더 나은 검색 결과를 얻을 수 있게 해주지만, 다른 한편으로는 웹마스터가 이 패턴을 이해하는 것을 허용하지 않으므로 자신의 이익을 위해 영향을 미칠 수 있습니다.

매트릭스넷 기술에 대한 자세한 내용:

2010

Samokatnaya Street의 오래된 사무실은 과거의 일이며 회사 전체가 새로운 맨션으로 이전했습니다. 사실 이게 2010년의 메인이벤트가 되었어요

우리는 우리가 생각하는 것만큼 독특하지 않습니다. 우리 이전 수백만 명의 사람들이 의아해했고 우리 이후 수백만 명이 거의 동일한 질문으로 검색 엔진을 의아해하게 될 것입니다. 반면에 우리는 예측하기가 너무 어렵습니다. 요청의 공식화는 우리가 인식하지 못하는 수많은 요인의 영향을 받습니다. 그리고 적어도 이러한 이유로 우리 각자의 요청은 아무리 진부하더라도 개별적인 접근 방식이 필요합니다.

실제로 Yandex 검색 엔진의 전체 작업은 사람이 실제로 알고 싶어하는 것이 무엇인지 이해하는 것과 몇 초 안에 인터넷에 있는 수십억 개의 문서 중에서 적합한 것을 찾는 두 가지 간단한 작업으로 귀결됩니다.

지문 채취

검색 엔진의 운영 체제는 매트릭스와 다소 유사하며, 검색 로봇(복잡하고 독립적인 의사 결정 프로그램)은 스미스 요원과 유사합니다.

누군가가 무언가를 알아야 할 때마다 전체 인터넷을 검색하지 않기 위해 검색 엔진은 작업의 일부를 미리 수행합니다. 즉, 수천 개의 검색 로봇을 사용하여 웹에 무엇이 있는지, 어디에 있는지 확인합니다. 기본형과 고속형의 두 가지 유형이 있습니다. 주요한 것은 인터넷 전체를 크롤링하고 처리하며 빠른 것은 1분 또는 몇 초 전에 나타난 문서입니다. 로봇 프로그램의 임무는 사용자에게 적합하고 유용한 정보를 선택하고 처리하며 오래되고 불필요한 모든 정보를 제거하는 것입니다. 어떤 면에서 이것은 쓰레기를 분류하는 것을 연상시킵니다. 한 용기에는 종이, 다른 용기에는 유리, 세 번째 용기에는 플라스틱, 네 번째 용기에는 음식물 쓰레기…

로봇이 수집한 정보는 소위 인터넷 캐스트를 형성합니다. 수천 개의 Yandex 서버에 저장되며 지속적으로 업데이트됩니다. 너겟은 어떤 정보를 어디서 찾을 수 있는지 알려주는 목록과 같습니다. 이 목록에서 각 키워드에는 하나가 아닌 수백만 개의 "페이지"가 있습니다. 사용자가 모든 너깃 업데이트를 사용할 수 있도록 하기 위해 업데이트가 저장소에서 "기본 검색"으로 이동됩니다. 메인 로봇의 데이터는 며칠 간격으로 전송되고 빠른 로봇의 데이터는 실시간으로 전송됩니다.

깨끗한 물을 가지고 오세요

삽화: EVGENY 톤코노지

에 대한 답변을 찾고 있습니다. 질문준비된 베이스에서 기계는 두 가지 주요 어려움에 직면합니다. 첫 번째 어려움은 언어입니다. 질문에 대한 답을 찾기 전에 기계가 어떤 언어로 답을 찾아야 하는지 이해하는 것이 중요합니다. 예를 들어, 러시아어를 사용하는 사람의 경우 "이고르 왕자의 분대"를 검색하면 군대에 대한 정보가 포함된 문서가 검색되고, 우크라이나인의 경우 "이고르 왕자의 분대"는 그의 아내인 올가 공주가 언급된 문서도 반환됩니다. 우크라이나어로 "아내"는 "분대"입니다. 그리고 풍부한 러시아어에서는 동일한 단어나 그 파생어가 다른 의미를 가질 수 있습니다. 예를 들어, "steel"이라는 단어는 명사 "steel"과 동사 "to be"의 형태 중 하나입니다. 두 번째 어려움은 인간의 심리입니다. 요청을 입력할 때, 우리는 요청의 문구가 기계의 두뇌가 작동하는 수학적 분석의 원리와 일치하는지 자연스럽게 걱정하지 않고 빠르고 정확한 답변을 기대합니다. 예를 들어, 검색창에 "나폴레옹"이라는 단어를 입력하면 케이크 레시피나 프랑스 황제의 전기, 코냑 구입, 정신병원 주소 찾기 등 무엇을 얻고 싶어 할까요?

이러한 상황에서는 여러 가지 기술이 활용됩니다. 귀하의 요청을 지정하는 검색창 아래에 몇 가지 힌트를 제공할 수 있습니다. 예를 들어, 나폴레옹 요리법이나 나폴레옹 - 보나파르트 중에서 필요한 것을 선택하십시오. 사용자가 기계의 요청에 응답하지 않고 "나폴레옹"에 단어를 추가하지 않으면 "스펙트럼" 기술이 문제를 해결하는 데 도움이 됩니다. 도움을 바라지 않고 기계는 즉시 여러 범주(케이크 관련, 그리고 황제와 말에 대해 ..). 또한 개인화 메커니즘은 사용자를 이해하는 데 도움이 됩니다. 즉, 이 사용자가 하루, 2, 3 또는 몇 달 전에 자신의 컴퓨터에서 찾고 있던 내용에 대한 기계의 지식입니다. 요리에 대해 Yandex에 자주 질문하면 기계가 먼저 나폴레옹이 케이크라고 말하는 결과가 나왔습니다.

조합: 관심 클럽

검색 엔진의 임무는 단순히 검색 쿼리에서 단어와 구문이 포함된 문서를 선택하는 것이 아닙니다. 기계는 어떤 문서가 우리의 상충되는 요구 사항을 충족하는지, 왜 이를 충족하는지 이해해야 합니다. 우리는 케이크 나폴레옹에 대한 정보를 얻고 싶습니까? 아니면 몇 년 동안 가식적인 이름을 가진 피트니스 클럽을 방문했거나 심지어 키가 작은 사람들의 콤플렉스에 대해 완전히 걱정하고 있습니까? 어쨌든 문제를 해결하려면 사소한 접근 방식이 필요합니다.

Yandex 검색 프로그램의 제작자는 선택권을 기계에 위임하여 이러한 접근 방식을 찾았습니다. 한편으로는 영혼이 없지만 매우 빠르고 똑똑한 기계는 개인으로서 우리에 대해 아무것도 모르고 알고 싶지 않으며, 다른 한편으로는 모든 사람에 대해 가능한 한 많은 것을 찾으려고 노력합니다.

사용자의 지리적 위치와 쿼리에 대한 언어적 분석 외에도 검색 엔진은 인간에게 전혀 명확하지 않은 수천 가지 기준을 사용합니다.

비결은 기계가 이러한 기준을 독립적으로 개발하고 업데이트한다는 것입니다.

이는 단순히 수백만 명의 사용자 선호도 및 사용자 행동에 대한 데이터를 사용하고 이 "산술 평균"을 쿼리 기록과 연관시킵니다. 매트릭스가 개발한 수천 가지 사용자 관심 분야 범주를 비교하면서 매트릭스 자체를 안내하는 원칙은 원칙적으로 "관심사"가 무엇인지에 대한 전통적인 인간의 생각에 맞지 않는 경우가 많습니다. 수만 개가 있습니다. 그들은 서로 다르고 때로는 재미있는 조합을 만듭니다. 예를 들어 이러한 조합 중 하나는 검색 결과가 영원을 사육하는 사람의 관심분야와 일치하는 것일 수 있습니다. 동시에 사람은 뉴트에 관심이있을뿐만 아니라 이미 번식하고 있지만 첫해에만 관심이 있습니다.

평가. 돕는 손

물론 매트릭스는 수만 가지 기준에 따라 사용자에게 무엇을, 어떤 순서로 표시해야 하는지 스스로 결정합니다(고등 수학의 도움으로). 그러나 Matrix는 또한 살아있는 사람을 사용합니다. 소위 평가자라고 불리는 1000명의 Yandex 직원이 특정 요청에 대한 검색 결과를 평가합니다(물론 모든 요청이 평가되는 것은 아니며 실시간으로 수행되지는 않습니다). 일반 사용자: 기계만큼 합리적이지 않고 공식이 정확하지 않으며 모순적이고 감정적입니다.

1. 용어 및 정의 개인 데이터 처리에 관한 본 계약(이하 "계약")에서 아래 용어의 정의는 다음과 같습니다. 운영자 - 개인 기업가 Oleg Aleksandrovich Dneprovsky. 계약 수락 - 개인 데이터를 전송하고 처리함으로써 계약의 모든 조건을 완전하고 무조건적으로 수락합니다. 개인 데이터 - 사용자(개인 데이터의 대상)가 사이트에 입력한 정보로서 이 사용자와 직간접적으로 관련된 정보입니다. 사용자 - 모든 개인 또는 법인, 사이트의 입력 필드를 작성하는 절차를 성공적으로 완료했습니다. 입력란 작성 - 사용자가 이름, 성, 전화번호, 개인 주소를 보내는 절차 이메일(이하 개인 데이터라고 함)은 사용자 식별을 목적으로 생성된 사이트 등록 사용자 데이터베이스에 저장됩니다. 입력 필드를 작성하면 개인 데이터가 운영자의 데이터베이스로 전송됩니다. 입력 필드를 작성하는 것은 자발적입니다. 웹사이트 - 인터넷에 위치하며 한 페이지로 구성된 웹사이트입니다. 2. 일반 조항 2.1. 이 계약은 요구 사항을 기반으로 작성되었습니다 연방법 2006년 7월 27일자 No. 152-FZ "개인 정보" 및 "법 위반"에 관한 제13.11조 조항 러시아 연방 개인 데이터 분야"에 관한 러시아 연방 행정법 위반 조항은 운영자가 사이트를 사용하는 동안 사용자에 대해 얻을 수 있는 모든 개인 데이터에 적용됩니다. 2.2. 사이트에서 사용자가 입력 필드를 작성한다는 것은 사용자가 본 계약의 모든 조건에 무조건 동의한다는 것을 의미합니다(계약 수락). 이러한 조건에 동의하지 않는 경우 사용자는 사이트의 입력 필드를 작성하지 않습니다. 2.3. 운영자에 대한 개인 데이터 제공 및 운영자의 처리에 대한 사용자의 동의는 운영자의 활동이 종료되거나 사용자가 동의를 철회할 때까지 유효합니다. 본 계약을 수락하고 등록 절차를 거쳐 사이트에 접속함으로써 사용자는 자신의 자유 의지와 이익을 위해 처리를 위해 자신의 개인 데이터를 운영자에게 전송한다는 것을 확인하고 다음에 동의합니다. 그들의 처리. 사용자는 자신의 개인 데이터 처리가 2006년 7월 27일자 연방법 No. 152-FZ "개인 데이터에 관한"에 근거하여 운영자에 의해 수행된다는 통지를 받습니다. 3. 운영자에게 전송되는 사용자의 개인정보 및 기타 정보 목록 3.1. 운영자의 웹사이트를 사용할 때 사용자는 다음과 같은 개인 데이터를 제공합니다: 3.1.1. 성, 이름, 부칭, 전화번호(집 또는 휴대폰), 개인 이메일 주소를 포함하여 입력 필드를 작성할 때 및/또는 사이트 서비스를 사용하는 과정에서 사용자가 독립적으로 자신에 대해 제공하는 신뢰할 수 있는 개인 정보입니다. 3.1.2. IP 주소, 쿠키 정보, 사용자 브라우저(또는 서비스에 액세스하는 기타 프로그램)에 대한 정보를 포함하여 사용자 장치에 설치된 소프트웨어를 사용하여 사이트 서비스를 사용하는 동안 자동으로 사이트 서비스로 전송되는 데이터. 3.2. 운영자는 사용자가 제공한 개인 데이터의 정확성을 확인하지 않습니다. 이 경우 운영자는 사용자가 입력란에 제시된 질문에 대해 신뢰할 수 있고 충분한 개인정보를 제공했다고 가정합니다. 4. 개인 데이터 수집 및 사용 목적, 규칙 4.1. 운영자는 서비스 제공 및 이용자에게 서비스 제공을 위해 필요한 개인정보를 처리합니다. 4.2. 4. 운영자는 이용자의 개인정보를 다음의 목적을 위해 사용합니다. 2.1. 사용자 식별 4.2.2. 사용자에게 맞춤형 서비스 제공(서신 발송을 통해 회사의 새로운 프로모션 및 서비스에 대한 알림 포함) 4.2.3. 서비스 이용, 서비스 제공, 사용자의 요청 및 신청 처리와 관련된 알림, 요청 및 정보 전송을 포함하여 필요한 경우 사용자와의 연락을 유지합니다. 4.3. 개인정보를 처리하는 과정에서 수집, 기록, 체계화, 축적, 저장, 명확화(업데이트, 변경), 추출, 이용, 차단, 삭제, 파기 등의 조치가 수행됩니다. 4.4. 사용자는 특정 경우에 자신이 지정한 정보가 러시아 연방 현행법에 따라 러시아 연방의 승인된 국가 기관에 제공될 수 있다는 점에 반대하지 않습니다. 4.5. 사용자의 개인 데이터는 운영자의 전체 활동 기간 동안 본 계약에 규정된 방식으로 운영자에 의해 저장되고 처리됩니다. 4.6. 개인 데이터 처리는 데이터베이스, 자동화, 기계적 및 수동 방법을 유지하여 운영자에 의해 수행됩니다. 4.7. 사이트는 쿠키 및 기타 기술을 사용하여 사이트 서비스 사용을 추적합니다. 이 데이터는 사이트의 기술 운영을 최적화하고 서비스 제공 품질을 향상시키는 데 필요합니다. 사이트는 사이트의 각 방문자에 대한 정보(URL, IP 주소, 브라우저 유형, 언어, 요청 날짜 및 시간 포함)를 자동으로 기록합니다. 사용자는 사이트 방문 시 개인 데이터 제공을 거부하거나 쿠키를 비활성화할 권리가 있지만, 이 경우 사이트의 모든 기능이 제대로 작동하지 않을 수 있습니다. 4.8. 본 계약에 제공된 기밀 유지 조건은 사용자가 사이트에 머무르고 사이트를 사용하는 동안 운영자가 사용자에 대해 얻을 수 있는 모든 정보에 적용됩니다. 4.9. 본 계약을 실행하는 동안 공개적으로 공개된 정보와 당사가 액세스할 수 있는 소스에서 당사자 또는 제3자가 얻을 수 있는 정보는 기밀이 아닙니다. 무료 이용누구에게나. 4.10. 운영자는 무단 액세스, 수정, 공개 또는 파기로부터 사용자 개인 데이터의 기밀성을 보호하기 위해 다음을 포함하여 필요한 모든 조치를 취합니다. 데이터 수집, 저장 및 처리 프로세스에 대한 지속적인 내부 검증을 보장하고 보안을 보장합니다. 데이터의 물리적 보안을 보장하여 무단 액세스를 방지합니다. 기술 시스템, 운영자가 개인 데이터를 저장하는 사이트의 운영을 보장합니다. 개인 데이터에 대한 액세스는 운영자의 직원 또는 사용자에 대한 서비스 제공, 사이트 운영, 개발 및 개선과 직접 관련된 업무를 수행하기 위해 이 정보가 필요한 승인된 사람에게만 제공됩니다. 4.11. 사용자의 개인정보는 사용자가 자발적으로 자신에 관한 정보를 제공하는 경우를 제외하고는 비밀이 유지됩니다. 공개 액세스무제한의 사람들에게. 4.12. 운영자가 사용자의 개인 데이터를 전송하는 것은 운영자를 재구성하고 운영자의 법적 승계자에게 권리를 양도하는 동안 합법적이며, 운영자가 받은 것과 관련하여 본 계약의 조건을 준수해야 하는 모든 의무는 다음과 같습니다. 법정상속인에게 양도 개인정보. 4.13. 본 정책은 운영자의 웹사이트에만 적용됩니다. 회사는 검색 결과를 포함하여 운영자 웹사이트에서 제공되는 링크를 통해 사용자가 액세스할 수 있는 제3자 사이트(서비스)를 통제하거나 책임지지 않습니다. 해당 사이트(서비스)에서는 사용자로부터 기타 개인 정보가 수집되거나 요청될 수 있으며 기타 조치도 수행될 수 있습니다. 5. 개인 데이터의 주체로서 사용자의 권리, 사용자의 개인 데이터 변경 및 삭제 5.1. 사용자에게는 다음과 같은 권리가 있습니다. 5.1.2. 개인 데이터가 불완전하거나, 오래되었거나, 부정확하거나, 불법적으로 획득되었거나, 명시된 처리 목적에 필요하지 않은 경우 운영자에게 개인 데이터를 명확히 하고 이를 차단하거나 파기하도록 요구하고, 또한 자신의 권리를 보호하기 위해 법률이 제공하는 조치를 취해야 합니다. 5.1.3. 다음을 포함하는 정보를 포함하여 개인 데이터 처리에 관한 정보를 받습니다. 5.1.3.1. 운영자의 개인 데이터 처리 사실 확인 5.1.3.2. 운영자가 사용하는 개인정보 처리 목적 및 방법 5.1.3.3. 운영자의 이름과 위치 5.1.3.4. 연방법에 의해 해당 데이터 표시에 대한 다른 절차가 제공되지 않는 한, 관련 개인 데이터 주제와 관련된 처리된 개인 데이터, 수령 출처 5.1.3.5. 저장 기간을 포함한 개인 데이터 처리 조건 5.1.3.6. 러시아 연방의 현행법에 의해 제공되는 기타 정보. 5.2. 개인 데이터 처리에 대한 동의 철회는 운영자에게 적절한 서면(유형 매체에 인쇄되고 사용자가 서명함) 통지를 보내어 사용자가 수행할 수 있습니다. 6. 운영자의 책임. 개인 데이터에 대한 접근 6.1. 운영자는 운영자 웹사이트 사용자의 개인 데이터에 대한 무단 및 비표적 접근을 방지하기 위해 최선을 다합니다. 이 경우, 사이트 사용자의 개인 데이터에 대한 승인되고 표적화된 액세스는 운영자 사이트의 목표 및 주제 프레임워크 내에서 구현되는 모든 이해 관계자의 액세스로 간주됩니다. 동시에 운영자는 다음과 같은 결과로 발생한 사용자 개인 데이터의 부적절한 사용에 대해 책임을 지지 않습니다. 소프트웨어운영자의 통제를 벗어난 기술적 수단 및 네트워크; 의도된 목적 이외의 제3자에 의한 운영자 웹사이트의 의도적 또는 비의도적 사용과 관련하여; 6.2 운영자는 제3자의 무단 또는 우발적인 접근, 파기, 수정, 차단, 복사, 배포 및 기타 불법적인 행위로부터 사용자의 개인정보를 보호하기 위해 필요하고 충분한 조직적, 기술적 조치를 취합니다. 7. 개인정보 보호정책의 변경. 관련법률 7.1. 운영자는 사용자에게 특별한 통지 없이 본 규정을 변경할 권리가 있습니다. 현재 판이 변경되면 날짜가 표시됩니다.마지막 업데이트

. 규정의 새 판에서 달리 규정하지 않는 한, 규정의 새 판은 발행된 순간부터 효력을 발생합니다. 7.2. 본 규정 및 본 규정의 적용과 관련하여 발생하는 사용자와 운영자 간의 관계에는 러시아 연방 법률이 적용됩니다.

동의합니다 동의하지 않습니다

안녕 친애하는 친구! 이 기사에서 우리는 Yandex 검색 엔진을 계속 살펴볼 것이며, 기억하시는 것처럼 이전 기사에서 우리는 러시아 및 기타 지역의 경쟁사 중 1위를 차지하는 이 위대한 회사의 창립 역사에 대해 논의했습니다.

이 모든 것이 좋지만 초보자와 숙련된 사이트 빌더는 자신의 프로젝트를 TOP 검색 결과의 첫 번째 위치에 올리는 방법과 관련된 가장 중요한 질문에 관심이 있습니다.

따라서 어떤 실수를 저지를 수 있는지, 그리고 일반적으로 러시아 검색 엔진에서 무엇을 기대할 수 있는지 이해하기 위해 Yandex 검색 엔진이 어떻게 작동하는지 살펴보겠습니다.

지난 기사에서 우리는 논의했습니다. 이 주제는 꽤 흥미롭고 유용했습니다. 그래서 나는 그것을 보완하고 심화시키기로 결정했습니다.

그래서 저는 "왜 검색 엔진이 문서를 색인화합니까?"라는 질문에 약간 매료되었을 것입니다. 남은 것은 "어떻게"라는 질문을 알아내는 것뿐입니다.

웹사이트 순위 알고리즘

먼저 모든 검색 엔진의 기본이 되는 몇 가지 알고리즘에 대해 알아 보겠습니다.

— 직접 검색 알고리즘.

이 알고리즘의 경우 블로그의 각 페이지에서 텍스트 파일이 생성됩니다. 이 파일에는 귀하가 사용한 모든 단어가 알파벳순으로 나열되어 있습니다. 텍스트에서 이 단어의 위치도 표시됩니다(텍스트의 좌표).

그거면 충분해 빠른 방법, 그러나 일부 오류와 함께 검색이 이미 발생했습니다.

여기서 이해해야 할 가장 중요한 점은 이 알고리즘은 블로그에서 검색하는 것이 아니라 인터넷에서 검색하는 것이 아니라는 점입니다. 그리고 별도로 텍스트 파일, 오래 전에 만들어진 것입니다. 로봇이 당신에게 왔을 때. 그리고 이러한 파일(역방향 색인)은 Yandex 서버에 저장됩니다.

이것이 기본 검색 알고리즘이었습니다. 저것들. Yandex가 간단히 찾는 방법 필요한 서류. 이것에는 아무런 문제가 없을 것 같습니다.

하지만 Yandex는 1개 이상, 심지어 100개 이상의 문서를 알고 있지만, 내 소스의 최신 데이터에 따르면 Yandex는 약 110억 개의 문서(10,727,736,489페이지)를 알고 있습니다.

그리고 이 모든 수량 중에서 요청에 맞는 문서를 선택해야 합니다. 그리고 더 중요한 것은 어떻게든 순위를 매겨야 한다는 것입니다. 저것들. 중요도에 따라, 또는 오히려 독자에게 유용한 정도에 따라 정렬합니다.

수학적 검색 모델

이 문제를 해결하기 위해 수학적 모델이 구출됩니다. 이제 가장 간단한 모델에 대해 이야기하겠습니다.

부울 수학적 모델– 문서에 단어가 나타나면 문서가 발견된 것으로 간주됩니다. 우연일 뿐이고 복잡한 것은 없습니다.

그러나 여기에는 문제가 있습니다. 예를 들어, 사용자로서 인기 있는 단어 또는 러시아어에서 가장 일반적이고 모든 문서에서 발견되는 전치사 "v"를 입력하면 매우 많은 결과가 제공됩니다. 당신은 그런 숫자조차 깨닫지 못하고 있는데, 얼마나 많은 문서를 찾았나요? 따라서 다음과 같은 매트 모델이 등장했습니다.

벡터 수학적 모델– 이 모델은 문서의 "무게"를 결정합니다. 우연의 일치가 일어날 뿐만 아니라, 단어가 여러 번 나타나야 합니다. 또한, 단어가 많이 나타날수록 관련성(준수성)이 높아집니다.

모든 검색 엔진이 사용하는 벡터 모델입니다.

확률 모델– 더 복잡합니다. 원칙은 다음과 같습니다. 검색 엔진이 페이지 템플릿 자체를 찾았습니다. 예를 들어 Yandex의 역사에 대한 정보를 찾고 있습니다. Yandex는 일종의 표준을 저장합니다. 이것이 Yandex에 대한 이전 기사가 될 것이라고 가정해 보겠습니다.

그리고 그는 이 기사와 다른 모든 문서를 비교할 것입니다. 그리고 여기의 논리는 다음과 같습니다. 귀하의 블로그 페이지가 내 기사와 더 유사할수록 귀하의 블로그 페이지가 독자에게도 유용하고 Yandex의 역사에 대해서도 알려줄 가능성이 더 높습니다.

사용자에게 표시해야 하는 문서 수를 줄이기 위해 관련성 개념이 도입되었습니다. 규정 준수.

귀하의 블로그 페이지가 주제와 얼마나 관련성이 있습니까? 이는 검색 품질과 관련하여 중요한 주제입니다.

평가자 - 그들은 누구이며 어떤 책임을 지는가?

이러한 관련성은 알고리즘의 품질을 평가하는 데에도 필요합니다.

이를 위해 특수 부대 본부가 있으며 이를 평가자라고 합니다. 검색결과를 손으로 샅샅이 살펴보는 특별한 사람들입니다.

사이트 확인 방법, 평가 방법 등에 대한 지침이 있습니다. 그리고 귀하의 페이지가 검색어에 적합한지 여부를 수동으로 결정합니다.

그리고 검색 알고리즘의 품질은 평가자의 의견에 따라 달라집니다. 모든 평가자가 검색 결과가 요청과 일치하지 않는다고 말하면 이는 순위 알고리즘이 잘못되었으며 Yandex가 비난받을 유일한 사람임을 의미합니다.

평가자가 단 하나의 사이트만 요청을 충족하지 못한다고 말하면 해당 사이트가 멀리 떨어진 곳으로 날아가 검색 결과에서 낮아진다는 의미입니다. 보다 정확하게는 전체 사이트가 아니라 단 하나의 기사이지만 이것이 "요점이 아닙니다"입니다.

물론 평가자가 모든 기사를 손과 눈으로 검토하고 평가할 수는 없습니다. 이것은 이해할 수 있습니다.

그리고 페이지 순위를 결정하는 다른 매개변수가 도움이 됩니다.

예를 들어 다음과 같은 것들이 많이 있습니다.

페이지 무게(vIC, PageRank, 아기 범프전체적으로);
도메인 권한;
요청에 대한 텍스트의 관련성
쿼리에 대한 외부 링크 텍스트의 관련성
다른 많은 순위 요소도 포함됩니다.

평가자는 의견을 제시하고 설정을 담당하는 사람은 수학적 모델순위는 차례로 공식을 편집하여 검색 엔진이 더 잘 작동하도록 합니다.

공식의 성능을 평가하기 위한 주요 기준은 다음과 같습니다.

1. 검색 엔진 결과의 정확성- 요청과 일치하는 문서의 비율(관련) 저것들. 요청과 일치하지 않는 페이지가 적을수록 좋습니다.

2. 검색엔진 결과의 완전성관련 웹페이지의 비율입니다. 이 요청컬렉션에 있는 관련 문서의 총 개수(검색 엔진에서 찾은 페이지의 총 개수)입니다.

예를 들어, 전체 컬렉션에 있는 페이지보다 관련 페이지가 더 많은 경우 검색결과, 이는 출력이 불완전하다는 것을 의미합니다. 이는 관련 웹페이지 중 일부가 필터링되었기 때문에 발생했습니다.

3. 검색 엔진 결과의 관련성- 이는 스니펫에 작성된 내용을 웹페이지와 준수하는 것입니다. 예를 들어 문서가 매우 다르거나 전혀 존재하지 않더라도 검색 결과에는 계속 표시될 수 있습니다.

검색 결과의 관련성은 검색 로봇이 컬렉션에서 문서를 스캔하는 빈도에 따라 직접적으로 달라집니다.

컬렉션 수집(사이트 페이지 색인화)이 수행됩니다. 특별 프로그램- 검색 로봇.

검색 로봇은 인덱싱을 위한 주소 목록을 받아 복사한 후, 복사된 웹 페이지의 내용을 처리하기 위해 역인덱스로 변환하는 알고리즘으로 보냅니다.

글쎄요, 말하자면 "간단히" 우리는 검색 엔진의 원리에 대해 논의했습니다.

요약해보자:

검색 로봇이 귀하의 블로그에 찾아옵니다.
검색 로봇은 후속 검색을 위해 페이지의 역방향 색인을 저장합니다.
수학적 모델을 사용하여 문서는 공식을 사용하고 평가자의 의견을 고려하여 검색 결과에 처리되고 표시됩니다.

이것은 매우 매우 간단합니다. Yandex 검색 엔진의 작동 방식에 대한 기본적인 이해를 얻으려면.

나는 이제 너무 많은 텍스트를 썼고 아마도 너무 많은 것이 명확하지 않을 것입니다. 그러므로 잠시 후에 이 기사로 돌아와서 이 비디오를 시청하는 것이 좋습니다.

이것은 나도 한때 배운 훌륭한 가이드입니다.

희망 주어진 정보귀하의 사이트 중 하나가 검색에서 관련 순위를 차지하는 이유를 더 잘 이해하고 이를 개선하기 위해 모든 노력을 다하는 데 도움이 될 것입니다.

이것으로 작별 인사를 드립니다. 질문이 있으시면 언제든지 댓글로 답변해 드리겠습니다. 아니면 기사에 추가하고 싶으신가요?

어쨌든 귀하의 의견을 표현하십시오. !

운영 체제 설정 및 최적화