Программа SiteSputnik. Документы, файлы, списки, таблицы
Программа SiteSputnik. и другая выдача программы
Дата выхода публикации: 19.06.18г.     
Последнее изменение: 10.02.23г.     
Новые видеоролики по программе

Аннотация
    В данной публикации собрана основная выдача, создаваемая программой SiteSputnik.
    Она приведена не в порядке значимости.


Перечень документов, файлов, списков, таблиц
    Название файла - его назначение ... .

  1. Запрос, Пакет, Проект - текст выполняемого Задания, а именно: Простого запроса, Пакета запросов, Проекта.

  2. URL-источников - список всех открытых при выполнении Задания адресов элементарных Источников информации.

  3. Экспорт-txt - список в виде текстового документа адресов всех найденных ссылок.

  4. Экспорт-htm - список в виде html-документа адресов всех найденных ссылок.

  5. Объединение ссылок уникальных - список в виде сниппетов всех найденных уникальных ссылок.

  6. Ссылки новые - список в виде сниппетов всех новых уникальных ссылок, точнее впервые найденных ссылок.

    Они не встречались ещё ни разу ни в одном из предыдущих выполнений.

  7. Экспорт-новые-txt - список в виде текстового документа адресов всех новых уникальных ссылок.

  8. Сайты новые - список только новых уникальных сайтов. Впервые найденные сайты. Определяются из адресов "Ссылок новых".

  9. Домены 3-го уровня новые - список только новых уникальных доменов 3-го уровня. Впервые найденные. Определяются из адресов "Ссылок новых".

  10. Ссылки открытые - список ранее открытых или скачаных ссылок в виде сниппетов.

  11. Загрузки - содержание открытых или скачаных ссылок.

  12. Все сниппеты в одном - если ссылка была найдена несколькими Источниками, то сниппеты и кеш-ссылки из разных источников для каждой ссылки объединяются в один сниппет.

    Разные кеш-копии одной ссылки и разные контенты сниппетов собираются в одном большом сниппете.

  13. Общие - список ссылок (в виде сниппетов), которые были найдены абсолютно всеми Источниками, задействованными в Задании.

  14. Заголовки - перечислены только заголовки и адреса ссылок (упрощенные сниппеты). Применимо практически для всех описанных и выше, и ниже документов.

  15. Выдача источника - для каждого источника его выдача сохраняется в отдельном файле.

  16. Аналитическое объединение - несколько списков Объединение ссылок уникальных или списков Ссылки новые объединяются в один список.

    ! Чем в большем количестве списков присутствует ссылка, тем ближе к началу "Аналитического объединения" она расположена.

  17. Разность - из одного списка удаляются ссылки, присутствующие в другом списке.

  18. Карты - иерархические (древовидные) структуры из адресов ссылок, найденных в Задании.

    Также в отдельных файлах создается папочная, ресурсная и доменная структура web-пространства, попавшего в поле зрения Задания.

  19. Карта сайта - иерархическая (древовидная) структура из принадлежащих сайту адресов ссылок, найденных в интернете.

    Обращения к самому сайту не выполняются, выполняются только запросы в поисковиках.

    Материализация видимого интернета.

  20. RSS-потоки все - список всех RSS-потоков, адреса которых размещены на открываемых или скачиваемых страницах в Задании.

  21. RSS-потоки новые - список только тех RSS-потоков из предыдущего списка, которые не встречались ещё ни разу ранее.

  22. RSS-потоки новые+ - список только тех RSS-потоков новых из предыдущего списка, контент которых содержит заданные ключевые фразы.

  23. URL-ссылки все - список всех ссылок, скачанных или размещенных в контенте скачанных, адреса которых удовлетворяют заданному фильтру.

  24. URL-ссылки новые - список только тех ссылок из предыдущего списка, которые не встречались ранее.

  25. URL-потоки новые - поток ссылок из предыдущего списка (это не RSS-потоки - это их эмуляция).

    Полезно, например, если страницы не содержат RSS-потоков или RSS-ки приносит не ту информацию, которая интересует.

  26. URL-потоки новые+ - поток ссылок из предыдущего списка, контенты которых содержат заданные ключевые фразы.

  27. Статистика по Источникам текущая (зеленая табличка) - показывает в абсолютном и процентном выражении эффективность работы каждого Источника

    для текущего выполнения Задания, а именно: сколько найдено им ссылок всего, сколько новых, сколько попавших в Рубрики.

  28. Статистика по Источникам обобщенная (голубая табличка) - показывает "усредненную" эффективность работы Источников, опираясь на Статистики текущие.

  29. Статистика по Источникам полная (розовая табличка) - показывает "усредненную" эффективность работы всех когда-либо примененных в Задании источников.

  30. Замечание: Все Пять Текущих статистик (п.27,30,31,32,33) могут быть представлены в xlsx-формате и при каждом выполненни Задания

    выгружены во внешнюю папку, которая может быть целевой для приложений вида Microsoft Power BI.


  31. Статистика по Рубрикам текущая сокращенная - показывает сколько ссылок попало в каждую Рубрику при текущем выполнении Проекта.

  32. Статистика по Рубрикам+Источники+их домены текущая - показывает сколько ссылок попало в Рубрику в разрезе Рубрика-Источник.

  33. Статистика по Рубрикам+Домены Ссылки текущая - показывает сколько ссылок попало в Рубрику в разрезе Рубрика-Домен ссылки.

  34. Статистика по Рубрикам текущая расширенная - самые подробные сведения (от 15 и выше характеристик) о Рубриках, Источниках, доменах, ссылках, ключевых фраз, ..., задействованных в Задании.

  35. Статистика по Рубрикам (желтая табличка) - показывает когда и сколько ссылок попало в каждую Рубрику (история заполнения Рубрик).

  36. График по статистике - графическое отображение Статистики внешими Приложениями, например Инфографика для Задания "Финансы".

  37. Сигнализация - табличка на базе Статистики по Рубрикам, описывающая условия возникновения сигнала.

  38. Чистый поток - полнотекстовая лента из очищенных от мусора контентов новых или всех ссылок, найденных и скачанных в Задании.

  39. Символьный поток - полнотекстовая лента из неочищенных контентов новых или всех ссылок, найденных и скачанных в Задании.

  40. Повторные - дубли контентов из Чистого или Символьного потоков перемещаются в этот документ.

  41. Все комментарии - лента из комментариев, написанных к ссылкам из "Чистого или Символьного потоков".

  42. Фрагменты новой информации - лента из фрагментов страниц, новых относительно их предыдущего содержания.

  43. Рубрика (Всё по Рубрике) - часть "Чистого или Символьного потока", или "Все комментарии", или "Фрагментов новой информации", удовлетворяющая правилам попадания в Рубрику.

  44. Пост-запрос - специальная рабочая Рубрика. Правила попадания в неё прописываются не в иерархии Рубрик или тексте Проекта, а в Настройках. Применяется и в +WebSpider, и в +News.

  45. Рубрика-Ссылки - перечислены все Рубрики, задействанные в Проекте, и для каждой Рубрики перечислены все попавшие в неё ссылки с их заголовками.

  46. Ссылка-Рубрики - перечислены все ссылки с их заголовками, найденные в Проекте, и для каждой ссылки перечислены Рубрики, в которые она попала.

  47. Неоткрывшиеся - перечислены все ссылки, которые не удалось открыть или скачать на любом этапе выполнения Задания.

  48. Невидимые - перечислены отсутствующие в поисковиках, но существующие и найденные методами поиска в невидимом интернете ссылки сайта.

  49. Подсвеченные (выделенные) фразы, точнее содержащие их предложения могут быть выведены в отдельный файл.

  50. Упоминание объектов - список ЮЛ и ФЛ, присутствующих на самых релевантных ссылках, вычисленных при сборе информации об объекте, и количество их упоминаний.

  51. Tаблица-htm - табличное представление документа в виде html-таблички (доступно для многих документов из этого списка).

  52. Таблица-xls - табличное представление документа в виде Excel-таблички (доступно для Рубрик и Чистых потоков).

  53. JSON-файл - представление документа в json-формате (доступно для Рубрик и Чистых потоков).

  54. Локальный файл - практически любой документ может быть отправлен в любое количество папок локальной сети.

  55. Web-файл - практически любой документ может быть отправлен в любое количество папок заданного сайта. Или телеграм-каналы.

  56. E-mail-файл - практически любой документ может быть отправлен по заданным электронным почтовым адресам.

  57. Проект главный - полный текст проекта, связанного с текущей папкой (текущим ящиком). Он хранится в библиотеке готовых проектов.

  58. Проект расширенный - содержит автоматически обнаруженные и автоматически подключенные источники вида RSS-потоки и URL-потоки, приносящие информацию в Рубрики.

  59. Проект проверочный - текст проекта, содержащий источники-кандидаты на попадание в Проект расширенный.

  60. Проект исполняемый - текст проекта, который выполнен. Может совпадать с главным, проверочным, расширенным проектом или получен из пакета с параметрами.

  61. Журнал ошибок и предупреждений - все ошибки, предупреждения и замечания по работе Задания - в одном месте.

  62. Практически любая выдача программы может быть сохранена как документ в формате PDF, DOCX, RTF, TXT, HTM или конвертирована в формат xlsx и json.

  63. Лог-файл программы - регистрация в хронологическом порядке основных событий и действий программы и запоминание их в текстовом файле.

  64. Лог-файл пользователя - ссылки на практически все перечисленные выше файлы выдачи СайтСпутника попадают в этот один файл, имеющий простую древовидную структуру. Он доступен в любое время.

  65. Планировщик Заданий - файл, содержащий расписание, по которому выполняются Задания. Он и тексты Заданий составляются Пользователями, т.е. к выдаче не относятся.



Экспорт документов
Вся выдача программы СайтСпутник, перечисленная в данной публикации, доступна для других Приложений (программ).


Список литературы.
Полный список публикаций о программе собран на этой странице https://sitesputnik.ru/Public.htm.
Сайт о программе - https://sitesputnik.ru/.
Скачать демо-версию программы можно отсюда.

Copyright © 2003-2023 ИП Мыльников Алексей Борисович. Все права защищены. E-mail: 1a@sitesputnik.ru, +7(8442) 73 71 23, +7(905) 3 92 97 92