Telegramがデータクラスタリングコンテストの第二段階を完了
Telegramメッセンジャーによって開催されたデータクラスタリングコンテストの第二段階が完了しました。40の提出物が現在テスト可能で、contest.comで確認できます。第二段階は2週間続き、その賞金は10万ユーロでした。
Telegramはこのコンテストを2019年に開始し、第一段階は11月18日に始まり12月2日に終了し、第二段階は5月11日に始まり5月25日に終了しました。
第一段階では合計112のアルゴリズムが提出され、この段階の賞金は10万ユーロでした。最良の解決策の作者はコンテストの第二段階に進むことができ、さらに10万ユーロの報酬を獲得するチャンスを得ました。しかし、第一段階に参加しなかった人々も、第二段階で運を試すことが奨励されました。
データクラスタリングコンテストの主な課題は、ニュースアグリゲーターを稼働させるモジュール、およびニュース記事のソートとグループ化アルゴリズムを作成することでした。最良の解決策は、テストとバグの識別後に審査員によって選ばれます。最終バージョンの作品はさらに開発されます。
参加者は、英語とロシア語の記事を強調表示し、それらをカテゴリやストーリーにグループ化するクラスタリングアルゴリズムを作成および改良する必要がありました。これに加えて、アルゴリズムは、着信記事を分析、保存およびインデックス化し、クエリに対してインデックスを最適化する必要があります。さらに、指定されたトピックに関する指定された期間のストーリーリストを重要度順に形成する必要があります。これらすべての記事は、ロシアの読者だけでなく、英語のニュース記事も国際的な読者に関連性があるべきです。
コンテスト参加者は、エントリを単独のtgnewsアプリケーションとして提出しました。同時に、それはCLIインターフェースおよびHTTPサーバーモードの2つのモードで動作できる必要があります。