get_all_outside_links($site,$file,$timeout,$separator="<br>"); - сохранить все внешние ссылки для заданного сайта
Функция на вход принимает параметры:
$site – сайт, по отношению к которому надо получить внешние ссылки $file – путь к файлу, куда сохранять внешние ссылки $timeout – максимальное время, отведенное на данную операцию $separator – строка разделитель внешних ссылок в файле и результате
После отработки функция возвращает результат своей работы в робот :
Рейтинг – рейтинг заданного сайта по Алексе
Пример использования get_all_outside_links (PHP):
<?php $xhe_host = "127.0.0.1:7013"; // подключим объект для управления эмулятором, если еще не подключен if (!isset($path)) $path="../../../Templates/init.php"; require($path); // начало echo "<hr><font color=blue>seo->".basename (__FILE__)."</font><hr>"; // 1 echo "1. Перейдем на сайт : "; echo $browser->navigate("http://ya.ru/")."<br>"; // 2 echo "2. Получим все внешние ссылки с сайта :\n\n "; echo $seo->get_all_outside_links("http://ya.ru/","c:\\outsidelinks.txt",100000); // конец echo "<hr><br>"; // Quit $app->quit(); ?>
Пример использования get_all_outside_links (C#):
#region using using System; using System.Diagnostics; using System.Collections.Generic; using System.Linq; using System.IO; using System.Text; using System.Threading; using XHE; using XHE.XHE_DOM; using XHE.XHE_System; using XHE.XHE_Window; using XHE.XHE_Web; #endregion class Program:XHEScript { static void Main(string[] args) { // init XHE server="127.0.0.1:7010"; InitXHE(); // начало echo("<hr><font color=blue>seo.get_all_outside_links</font><hr>"); // 1 шаг echo("1. Перейдем на сайт : "); echo(browser.navigate("http://bigfozzy.com/")+"<br>"); // 2 шаг echo("2. Получим все внешние ссылки с сайта (выполняется долго, парсит все страницы сайта): <br><br>"); echo(seo.get_all_outside_links("http://bigfozzy.com/","outsidelinks.txt",100000)); // конец echo("<hr><br>"); app.quit(); } }
Пример использования get_all_outside_links (Python):
# Additional paths import sys sys.path.insert(0, '../../../Templates PY/') xhe_host = "127.0.0.1:7012" from xweb_human_emulator import * # начало echo("<hr><font color=blue>seo.xxxxxxxxx</font><hr>") # 1 echo("1. Перейдем на сайт : ") echo(browser.navigate("http://ya.ru/"),"<br>") # 2 echo("2. Получим все внешние ссылки с сайта (выполняется долго, парсит все страницы сайта): ") echo(seo.get_all_outside_links("http://ya.ru/","c:\\outsidelinks.txt",100000)) # конец echo("<hr><br>") # Quit app.quit()
Пример использования get_all_outside_links (JS):
// подключим объект для управления эмулятором, если еще не подключен xhe_host="127.0.0.1:7010"; echo=require("../../../Templates JS/init.js"); // начало echo("<hr><font color=blue>seo.get_all_outside_links</font><hr>"); // 1 шаг echo("1. Перейдем на сайт : "); echo(browser.navigate("http://ya.ru/")+"<br>"); // 2 шаг echo("2. Получим все внешние ссылки с сайта (выполняется долго, парсит все страницы сайта): "); echo(seo.get_all_outside_links("http://ya.ru/","c:\\outsidelinks.txt",100000); // конец echo("<hr><br>"); // Quit app.quit();