ПредишенСледващото

Така че сега ние се надолу до самия синтактичен анализ, първо аз ще пост кода (за тези, които имат малко разум да се справят без моите коментари), а след това да започне да се обясни всичко тихомълком.

Var лист = SpreadsheetApp.getActiveSheet ();

Var гама = sheet.getRange ( "А2: I5000");

Var клетка = range.getCell (startRow, 1);

Var отговор = UrlFetchApp.fetch (URL);

за (Var I = 1; и<=10;i++)

Разбор онлайн магазини

В момента има 2 функция getconten и getPageContent. на getconten минаваме на необходимите данни и стартирайте функцията за getPageContent да се направи разбор страници сме преминали от getconten.

getconten функция: тук имаме един цикъл, равен на броя на страниците в този раздел. За всяко преминаване през цикъла, ние изпращаме линк към страница, както и броя на вече обработените стоки.

И така, това, което ние поставите линк към нашия сайт? Повечето сайтове имат сходна структура sayt.ru / профил /? Page = 1 страница, думата може да скриете всяка дума в този случай начало, често страница. Понякога на първа страница на тази променлива не е, просто трябва да отидете на втория пример. За по-добро разбиране Аз препоръчвам да прочетете за да прочетете за GET заявки тук или Google.

Формула 1 + 10 * (к-1) - е необходима, за да се запише преместени, вместо да презаписвате на документа, където 10 е броят на записите (предвид броя на записите по подразбиране за честота по-добре да отидете на желаната страница от друг браузър или! с тайните раздели, докато сте далеч; страницата точно както го вижда вашия скрипт).

getPageContent функция: става тук основната магия. Мисля, че си струва да се изясни само акцентите, можете да прочетете повече информация в Google, ако се интересувате за всяка от функциите.

sheet.getRange ( "A1: I5000") - тук ние подбираме диапазон от клетки, с които работим, аз препоръчвам да се сложи голям пробег.

за (Var I = 1; и<=10;i++) - параметры цикла, где 10 см.формулу выше (!Внимание! цифры должны совпадать с формулой вышей).

Основните параметри които сме си поставили вече са готови да се създаде разбор.

По-нататъшни действия означават, че имате основни понятия на HTML кода на страницата, ако не и силно препоръчваме първо да прочетете за тези неща.

И така отидох разбор:

За да поставите клетката някакъв текст от страницата, ние трябва да знаем изходно положение (старт) и крайна (край). За да направите това, ние откриваме един уникален низ за елемент, който ние искаме Spars, в случай на изображението на продукта е низ

Той е уникален, той е, че единствените продукти в същото време тя е на разположение за всяка позиция, но ще отнеме твърде много сграда по тази линия, в това ние намираме точката по-близо до информация и да я имате на резерв като начало. Паметни priplyusovyvat брой символи на ред.

започнете = textResp.indexOf ( "

"End) 24;

С края на още по-лесно тук обикновено затварящия маркер, или кавичките.

Следваща подниз функция извлича необходимите данни знаят къде започва и свършва.

След това просто присвояване на стойността в клетка.

И стъпка към новата колона, оставайки на една и съща линия .offset (ред, колона).

Незабравими край скок на нов ред и връщане към колоната нула.

клетка = cell.offset (1, 5); - 5, където броя на колоните, по които отидоха, или по-просто колко данни от стоките, които реи.

Сега нека да поговорим за своите достойнства и недостатъци по-подробно:

Той е напълно гъвкав, но функционалността му позволява Spars почти едни и същи, тъй като повечето от платените ПАРСЕРИ.

То не изисква инсталирането на софтуера.

Сред недостатъците е наличието на някои основни познания и наличието на логика, добре, малко опит. Аз не се използват други парсъри, но ми се струва, почти същия вход parog.

Синтактичен анализ достатъчно крайбрежен, но това е за свободното, т.е. той ще трябва да се адаптира към всяка задача, която е полезна само ако голям брой стоки.

В първата част на този текст, който е пред вас желаната информация, като например етикет или нещо друго. Този текст трябва да е уникално, т.е. не можеш просто маркер

за да изглежда. По принцип тази команда показва индексът на първата поява на подниз.

+24 е броят на знаците в една линия, ако това не бъде направено, клетката се добавя заедно с тази линия.

Тази опция за синтактичен анализ за каталожните позиции т.е. визуализации. Тя може да се превърне в стока, на самата карта Парс ако имате нужда от такава задача. Аз просто винаги е имал prveyu.

Въпреки, че след като аз Pars карти себе си, но е имало време, там е малко, не искам да го завърша като нещо

// започне = textResp.indexOf ( "

"End) 50;

// започне = textResp.indexOf ( "

Подкрепете проекта - споделете линка, благодаря!