Методы автоматического извлечения текстового содержимого Интернет-сайтов для их последующими классификации и анализадоклад на конференции