Sāksim uzreiz ar galveno skripta kodu:

#!/usr/bin/perl

# what-forum.pl skripts
# (c) 2010 Aleksandrs Aleksejevs, http://site/

izmantot stingru;

# komentētas rindas — stingrībai
# ja uzdevums ir apkopot dzinēja statistiku, atstājiet to kā ir
# ja veido forumu sarakstu - atceliet komentārus

mani $dati ;
$data .= $_while (<> ) ;

# pārbaudiet, cik daudz Powered by phpBB bez saites kājenē
izdrukāt "phpbb \n"
if ($dati =~ /]+href="[^"]*http:\/\/(?:www\.)?phpbb\.com\/?[^>]*>phpBB/i vai
# $data =~ /viewforum\.php\?[^""]*f=\d+/i vai
$data =~ /phpBB\-SEO/i vai
$dati =~ /) ;
izdrukāt "ipb \n"
if ($dati =~ /]+href="[^"]*http:\/\/(?:www\.)?invision(?:board|power)\.com\/?[^"]*"[^>]*> [^<]*IP\.Board/i vai
$dati =~ /]+href="[^"]*http:\/\/(?:www\.)?invisionboard\.com\/?[^>]*>Invision Power Board/i vai
$dati =~ /

/i vai
$dati =~ /index\.php\?[^""]*showforum=\d+/i) ;
drukāt "vbulletin \n"
if ($dati =~ /Pārsniedz:?[^<]+vBulletin[^<]+(?:Version)?/i vai
$dati =~ /) ;
drukāt "smf \n"
if ($dati =~ /]+href="[^"]*http:\/\/(?:www\.)?simplemachines\.org\/?[^>]*>Darbo SMF/i vai
$dati =~ /index\.php\?[^""]*board=\d+\.0/i) ;
drukāt "punbb \n"
if ($dati =~ /]+href="[^"]*http:\/\/(?:(?:www\.)?punbb\.org|punbb\.informer\.com)\/?"[^>]*> PunBB/i) ; #vai
# $data =~ /viewforum\.php\?[^""]*id=\d+/i);
drukāt "fluxbb \n"
# if($data =~ /viewtopic\.php\?id=\d+/i vai
if ( $dati =~ /]+href="http:\/\/(?:www\.)fluxbb\.org\/?"[^>]*>FluxBB/i) ;
drukāt "exbb \n"
if ($dati =~ /]+href="[^"]*http:\/\/(?:www\.)?exbb\.org\/?[^>]*>ExBB/i) ; # vai
# $data =~ /forums\.php\?[^""]*forums=\d+/i);
drukāt "yabb \n"
if ($dati =~ /]+href="[^"]*http:\/\/(?:www\.)?yabbforum\.com\/?[^>]*>YaBB/i vai
$data =~ /YaBB\.pl\?[^""]*num=\d+/i ) ;
drukāt "dleforum \n"
if ($dati =~ /\(Nodrošina DLE forums\)<\/title>/i vai
$dati =~ /]+href="[^"]+(?:http:\/\/(?:www\.)?dle\-files\.ru|act=copyright)[^"]*">DLE forums<\/a>/i) ;
drukāt "ikonboard \n"
if ($dati =~ /]+href="[^"]*http:\/\/(?:www\.)?ikonboard\.com\/?[^"]*"[^>]*>Ikonboard/i vai
$dati =~ /\n"
if ($dati =~ /\n"
# if($data =~ /forums\.php\?fid=\d+/i vai
# $data =~ /topic\.php\?fid=\d+/i vai
if ($dati =~ /]+href="http:\/\/(?:www\.)?flashbb\.net\/?"[^>]*>FlashBB/i) ;
drukāt "Stokesit \n"
# if($data =~ /forums\.php\?f=\d+/i vai
if ($dati =~ /]+href="http:\/\/(?:www\.)?stokesit\.com\.au\/?"[^>]*>[^\/]*Stokes IT/i) ;
drukāt "pjedestāls \n"
# if($data =~ /topic\.php\?t=\d+/i vai
if ($dati =~ /]+href=[""]?http:\/\/(?:www\.)?sopebox\.com\/?[""]?[^>]*>Podium/i) ;
drukāt "usebb \n"
# if($data =~ /forums\.php\?id=\d+/i vai
if ($dati =~ /]+href="http:\/\/(?:www\.)?usebb\.net\/?"[^>]*>UseBB/i) ;
drukāt "wrforum \n"
# if($data =~ /index\.php\?fid=\d+/i vai
if ($dati =~ /]+href="http:\/\/(?:www\.)?wr\-script\.ru\/?"[^>]*>WR\-Forum/i) ;
drukāt "vēl viens forums \n"
if ($data =~ /Vēl viens forums\.net/i vai
$dati =~ /default\.aspx\?g=posts&t=\d+/i) ;

Jūs atradīsit šo un citus skriptus, kas minēti šajā arhīvā.

Skripts kurš-forums.pl pārbauda HTML lapas kodu, lai noskaidrotu, vai tajā ir foruma programmas paraksti. Mēs izmantojām līdzīgu paņēmienu, definējot WordPress un Joomla, taču ir dažas atšķirības. Pirmkārt, pats skripts neielādē lapas kodu, bet nolasa to no stdin vai faila, kas nodots kā arguments. Tas ļauj vienreiz lejupielādēt lapu, piemēram, izmantojot wget, un pēc tam palaist to caur vairākiem analizatoriem, ja mums ir vairāk nekā viens. Otrkārt, šajā skriptā paraksta klātbūtne ir 100% dzinēja pazīme. Iepriekšējā reizē paraksta klātbūtne tikai palielināja svaru attiecīgajam dzinējam un “uzvarēja” dzinējs ar lielāko svaru. Es nolēmu, ka šajā gadījumā šāda pieeja tikai nevajadzīgi sarežģīs kodu.

Lai pārbaudītu skriptu, es veicu nelielu izpēti. Es sastādīju sarakstu ar vairākiem tūkstošiem forumu un palaidu katru no tiem, izmantojot savu skriptu, tādējādi nosakot programmas atbilžu procentuālo daudzumu un dažādu dzinēju popularitāti.

Lai iegūtu forumu sarakstu, es izmantoju savu Google parsētāju. Šādi vaicājumi tika nosūtīti meklētājprogrammai

vietne:forums.*.ru
vietne:talk.*.ru
site:board.*.ru
vietne:smf.*.ru
vietne:phpbb.*.ru
....

un tā tālāk. Failā atradīsit pilnu vaicājumu ģeneratora kodu gen-forumsearch-urls.pl. Papildus zone.ru tika izmantoti arī .su .ua .kz un .by. Iepriekšējā reizē bija grūti veikt šādu pētījumu, jo WordPress un Joomla vietņu vietrādī URL nav šādu parakstu. Katalogi, piemēram, cmsmagazine.ru/catalogue/, nenodrošina pietiekamu izlases lielumu. Kas ir 600 Drupal vietnes?

Jāatzīst, ka eksperimenta rezultāti mani sarūgtināja. No 12 590 pētītajām vietām dzinējs tika veiksmīgi identificēts tikai 7083, tas ir, tikai 56% gadījumu. Varbūt neņēmu vērā kādu dzinēju? Vai tiešām bija taisnība, ka pusei forumu bija instalēta Bitrix? Vai arī man vajadzēja pavadīt vairāk laika, meklējot parakstus? Kopumā šeit ir nepieciešami papildu pētījumi.

Starp 56% veiksmīgi identificēto dzinēju populārākie, kā jau gaidīts, bija IPB (31%), phpBB (26,6%) un vBulletin (26,5%).

Tiem ar lielu nobīdi seko SMF (5,8%) un DLEForum (5,3%). Mans mīļākais punBB bija tikai 6. vietā (1,64%). Es neieteiktu īpaši ticēt šiem skaitļiem (viņi saka, ka katrs trešais RuNet forums darbojas ar IPB), taču, protams, var izdarīt noteiktus secinājumus.

Piemēram, ja plānojat izveidot vietni foruma dzinējā un plānojat modificēt forumu, piemēram, maksāt lietotājiem 0,01 USD par katru ziņojumu ar automātisku līdzekļu izņemšanu reizi nedēļā, tad jums vajadzētu izvēlēties vienu no trim populārākajiem dzinējiem. Jo populārāks forums, jo lielākas iespējas atrast programmētāju, kurš to labi pārzina.

Ja dzinējā nav gaidāmas būtiskas izmaiņas, tad var būt jēga izvēlēties mazāk populāru dzinēju, piemēram, SMF vai punBB. Tas samazinās hakeru uzbrukumu skaitu jūsu forumam un tajā automātiski nosūtītā surogātpasta daudzumu.

Skripti forumu meklēšanai/identifikācijai var atrast arī daudz praktisku pielietojumu. Pirmā lieta, kas man ienāca prātā, bija sašķirot identificētos forumus pēc TIC un ievietot pirmajās simts ziņās ar saitēm uz kādu no manām vietnēm. Tomēr simtiem foruma dofollow saišu TCI nekādi neietekmēja (pagājuši 2 atjauninājumi), tāpēc labāk šeit netērēt laiku, ja vien pārejas neinteresē.

Skaidrs, ka minētā skriptu izmantošana nebūt nav vienīgā. Es domāju, ka jūs varat viegli izdomāt, kā vēl varat tos izmantot.

Sveiki, dārgie emuāra vietnes lasītāji. Tātad, mēs turpinām tēmu par foruma dzinēja iestatīšanu ar nosaukumu SMF, kuru sākām ierakstā par to. Tur mēs vēl neesam izveidojuši forumu krievu valodā, runājot par tulkojumu no angļu valodas interfeisa. Šobrīd gan neizskatās diez ko reprezentabls, bet pēc rusifikācijas (ja tas jau nav izdarīts) un atbilstošu sadaļu izveidošanas izskats būtiski uzlabosies.

Šodien mēs apskatīsim dizaina tēmas un padarīsim to krieviski, kā arī instalēsim komponentu JFusion, kas var darboties ar abiem dzinējiem (Jumla un SMF), kas ļaus mums izveidot kopīgu lietotāju bāzi diviem un tikai vienu veidlapu viņiem. reģistrācija un pieteikšanās.

Krievu valodas pakotnes motīvi un instalēšana

Simple Machines Forum dzinējs atbalsta iespēju mainīt motīvus, un tos var mainīt gan visam forumam, gan jo īpaši atsevišķām tā sadaļām. Personīgi es izmantoju noklusējuma motīvu, taču diezgan daudz izmaiņu tajā veicu manuāli. Jo īpaši es mainīju fonu, dažu elementu krāsas, pievienoju pulksteni zibatmiņas diskā, radio un daudz ko citu, par ko es runāšu turpmākajos šīs sadaļas ierakstos.

Kāpēc, veidojot forumu, neizmantoju nevienu no papildu tēmām? Nu, iespējams, viss ir saistīts ar manu slinkumu. Nē, man nebija slinkums meklēt un lejupielādēt jaunas tēmas, par laimi ir daudz vietu, kur to var izdarīt. Mans slinkums slēpjas citur.

Fakts ir tāds, ka viss šī dzinēja modifikāciju klāsts, kas paredzēts tā iespēju paplašināšanai, ir īpaši vērsts uz noklusējuma motīvu. Ļauj man paskaidrot. Ja jums ir noklusējuma motīvs, mod pievienošana SMF notiek dažu sekunžu laikā, un parasti tai nav nepieciešama koda manuāla rediģēšana.

Ja instalējat modi ar dizaina motīvu, kas atšķiras no noklusējuma, jums, kā saka, visas neapstrādātās daļas būs jāapstrādā ar failu. Citiem vārdiem sakot, jums būs jāizmanto FileZilla (lejupielādējiet un konfigurējiet to; jūs varat piekļūt vietnei, izmantojot FTP, un atvērt to foruma dzinēja failu rediģēšanai, kurā šī modifikācija veic izmaiņas.

Pēc tam meklējiet īsto vietu kodā un veiciet nepieciešamās darbības: vai nu aizstājiet kodu, vai dzēsiet, vai pievienojiet koda sadaļu pirms vai pēc vajadzīgā fragmenta. Ja uzskatāt, ka var būt apmēram ducis failu, kuros būs jāveic izmaiņas, varat iedomāties, cik apgrūtinoši tas būs. Šajā gadījumā jābūt ļoti uzmanīgam un nepieļautu kļūdas, jo pretējā gadījumā forums var neatvērties vispār.

Ja visas iepriekš minētās problēmas, kas saistītas ar ne-noklusējuma motīva izmantošanu, jūs nebiedē, varat tās lejupielādēt no šejienes. Tēmas tur ir sakārtotas sadaļās (minimālisms, tuvu klasiskajai, modernajai u.c.) un katrai no tām var redzēt tās ekrānuzņēmumu pilnekrāna režīmā. Es jums pastāstīšu, kā instalēt šīs pašas tēmas nedaudz vēlāk.

Ja jūs neesat rusificējis forumu dzinēja failu augšupielādes posmā hostingā, kā tas bija aprakstīts šī opusa pirmajā daļā (skatiet saiti raksta pašā sākumā), varat to izdarīt tagad. Krievu valodas pakotne ar nepieciešamo, kas iepriekš tika lejupielādēta no šīs lapas, ir jāizpako un pēc tam jāpārkopē mape Motīvi saknes mapē, kur jau ir direktorija ar tādu pašu nosaukumu.

Kad kopēšana ir pabeigta, jums jāpiesakās forumā, izmantojot administratora lietotājvārdu un paroli. Augšējā izvēlnē atlasiet “Administrators” un pēc tam kreisajā kolonnā noklikšķiniet uz “Servera iestatījumi”.

Atvērtajā logā atrodiet vienumu “Noklusējuma foruma valoda” un nolaižamajā sarakstā atlasiet krievu valodu un pēc tam lapas apakšā noklikšķiniet uz pogas “Saglabāt”.

Tas tā, tagad jūsu konference ir pilnībā krievu valodā.

Problēmu risināšana, instalējot modifikācijas, kas neatbalsta krievu valodu

Lūdzu, ņemiet vērā, ka turpmāk, pievienojot SMF modifikācijas, kurām nav tulkojuma krievu valodā, dažreiz var rasties problēmas ar mod iestatījumu parādīšanu administratora panelī. Patiesībā šie paši iestatījumi vienkārši nebūs redzami administratora panelī, jo... par tiem rusifikācijas faili nebūs. Tāpēc šīs problēmas risināšanai jums būs divas iespējas.

Pirmais veids ir pārslēgties uz angļu valodu visam forumam. Jūs varat redzēt, kā to var izdarīt dažas rindkopas iepriekš. Attiecīgi pēc nepieciešamo darbību veikšanas ar šiem iestatījumiem jums atkal būs jāatgriežas krievu valodā.

Otrā metode ir sarežģītāka, taču tā ļaus mums vienmēr, un ne tikai tad, kad ir aktivizēta angļu valoda, redzēt instalēto moduļu iestatījumus administratora panelī. Es pievēršos šim punktam tik detalizēti, jo jautājums, ka kāds ir instalējis modu un nevar atrast tā iestatījumus savas konferences administratora panelī, ir ļoti izplatīts.

Tātad, otrā metode ir tikko pievienoto modifikāciju rusifikācijas failiem pievienot tulkošanas virknes. Es jums pastāstīšu vēlāk, kā noteikt, kuri rusifikācijas faili ir jāmaina un kur tos iegūt. Tikmēr īslaicīgi varat izmantot pirmo metodi.

JFusion instalēšana vietņu un forumu integrācijai

Vispirms jums būs jālejupielādē JFusion un tā rusifikācija. Ieejot Joomla administratora panelī, mēs veicam standarta darbības: administratora paneļa augšējā izvēlnē atlasiet vienumus "Paplašinājumi" - "Instalēt/atinstalēt" - "Lejupielādēt pakotnes failu" - poga "Pārlūkot" - atrodiet failu ar komponents jfusion_package.zip datorā - noklikšķiniet uz pogas Augšupielādēt failu&Instalēt>.

Pēc tam tiek parādīts logs, kas informē, ka komponents ir veiksmīgi instalēts. Ja rodas problēmas, varat iepazīties ar dažu no tiem risinājumiem, izmantojot iepriekš norādīto saiti.

Tagad ir pienācis laiks rusifikācijai, kas tiek pievienota tieši tādā pašā veidā kā pati sastāvdaļa. Tie. atkārtojiet darbību secību: "Paplašinājumi" - "Instalēt/atinstalēt" - "Lejupielādēt pakotnes failu" - "Pārlūkot" - atrodiet JFusion Russification failu savā datorā - noklikšķiniet uz pogas "Lejupielādēt failu un instalēt". Tagad mēs varam doties uz iestatījumiem pa ceļu “Components” - “JFusion” un pārliecināties, ka rusifikācija ir veiksmīgi pievienota un darbojas.

Veiksmi tev! Uz drīzu tikšanos emuāra vietnes lapās

Jūs varētu interesēt

JFusion iestatīšana, lai apvienotu SMF forumu un Joomla vietni
JFusion moduļi ziņojumu parādīšanai no foruma vietnē, kā arī pogas izveidei SMF, lai atgrieztos Joomla
Izvēlnes vienuma izveide programmā Joomla, lai iekļūtu forumā, un lietotāja reģistrācijas pārsūtīšana no SMF uz vietni
SMF foruma instalēšana — Joomla 1.5 un Simple Machines foruma integrēšana, izmantojot komponentu JFusion
Joomla paplašinājumi - kas tie ir un kur lejupielādēt Joomla komponentus, moduļus un spraudņus, kā tos instalēt un noņemt
K2 komponents emuāru, katalogu un portālu izveidei vietnē Joomla - līdzekļi, instalēšana un rusifikācija Joomla fotoattēlu galerija — 3. daļa — galeriju izveide programmā Joomla 1.5, izmantojot komponentu Phoca Gallery — kategoriju pievienošana un attēlu augšupielāde fotoattēlu galerijā
ARTIO JoomSEF — CNC (SEF) saišu un virsraksta iestatīšana Joomla, kā arī 404 kļūdas lapas izveide, izmantojot šo paplašinājumu
Akeeba Backup (agrāk JoomlaPack) - Joomla vietnes dublējuma izveide un atjaunošana no dublējuma ar diviem klikšķiem

Organizē Botmaster Labs, nav plānots. Man nav laika, video vajadzīgs sacensībām, kā jauna tendence, lai gan ar labiem ekrānuzņēmumiem visu var izskaidrot vienkāršāk (mans IMHO), un es īsti nevēlos neko filmēt. Palicis ļoti maz ienesīgu tēmu, stulbais spams vispār vairs nevalda, te vajag padomāt un neviens tēmas nešaus, ja vien nemēģināsi novecojušās ielikt smukā iesaiņojumā un nedaudz piepūderēt. :) Bet tas nav par mums. Kopumā šie 3 “nedrīkst”, manuprāt, būtībā kļuva par šķēršļiem dalībai konkursā lielākajai daļai potenciālo dalībnieku. Tas ir tāpat kā automašīnas remonts no trim: lēts, kvalitatīvs, ātrs - serviss var izpildīt tikai 2 nosacījumus vienlaikus. sēdēt un izvēlēties to, kas jums ir tuvāks. :) Tāpat ir ar konkursu: man ir laiks, es zinu, kā uztaisīt video, bet nav tēmas, vai es zinu, kā uztaisīt video, ir tēma, bet man nav laika plkst. viss, vai man ir brīvs laiks un ir maza tēma, bet video ir bail. Bet tas ir labi, ja vienlaikus tiek izpildīti 2 nosacījumi. Nu, labi, atmetīsim dziesmu tekstus. Es turpināšu pie sevis. Es neplānoju, tas nozīmē, ka piedalījos konkursā, pat izvēlējos, par kuru rakstu balsošu. Lai ko jūs teiktu, Doz ļoti labi pārzina programmatūru un zina, kā to ļoti saprātīgi izmantot. Bet šodien uzzināju, ka konkursā ir parādījusies intriga. Izrādās, ka es nevarēšu balsot, un to varēs izdarīt tikai jaunpienācēji, kuri iegādājās programmatūru 2011. gadā, un konkurss ir paredzēts viņiem. Es biju nedaudz pārsteigts, bet īpašnieks ir džentlmenis. Konkurss ir reklāmas kampaņa, un Aleksandrs labāk zina, kā to īstenot. Vispār es tad nolēmu ievietot rakstu, nedaudz vieglāk ir rakstīt, ja ir skaidrs, kam, visam kolhozam, patiesībā to nav iespējams izdarīt.
Garais ievads ir beidzies, tagad pie lietas.
Kas vajadzīgs iesācējam, kad viņš ir iegādājies šādu superkombainu, kas ir Xrumer + Hrefer komplekss? Tieši tā, iemācieties strādāt pie tā un atmetiet ilūziju, ka jūs varat nopelnīt naudu, sākot sūtīt surogātpasta lapas. Ja jūs tā domājat, labāk nekavējoties ziedojiet savu naudu labdarībai. Jums jāiemācās izmantot kompleksa rīkus, vēlams to uzasināt sev. “Ņem vairāk – met tālāk” laiks ir pagājis. Kvantitāte dod vietu kvalitātei. Tas nozīmē, ka mēs paši saliksim bāzi; ja jūs neiemācīsieties to izdarīt, jūs atpaliksiet no vilciena. Protams, Khrefer mums palīdzēs šajā jautājumā. Ja plānojat reklamēt savus resursus Google tīklā, mums arī ir jāmeklē donoru vietnes, izmantojot Google. Manuprāt, tas ir saprotami un loģiski. Taču Google, tāpat kā vara kalna saimniece, neatdod savu bagātību visiem. Jums ir nepieciešama pieeja tam. Uzreiz gribu teikt, ka neceriet, ka, balstoties uz zīmēm, ko atrodat sabiedrībā, varēsiet kaut ko savākt. Iemesls, kāpēc tie ir pieejami publiski, ir tāpēc, ka tie ir bezvērtīgi. Tālāk tēmu neattīstīšu. Labāk ir pastāstīt, kā to pareizi salikt, lai jūs varētu redzēt rezultātu, pārējo varat izstrādāt pats, galvenais ir saprast principu. Mums ir jāsavāc pareizie, pamatojoties uz konkrēto mums nepieciešamo dzinēju īpašībām, nevis forumu īpašībām kopumā. Tā ir galvenā iesācēju kļūda – nekoncentrēties uz kādu konkrētu lietu, bet mēģināt aptvert visu pilnībā. Un arī, ja vēlaties parsēt vairāk vai mazāk normālu datu bāzi, pārtrauciet izmantot operatorus vaicājumos. Nav "inurl:", "site:", "title" utt. Google nekavējoties aizliedz tādus meklētājus kā jūs. Tāpēc mēs rūpīgi izpētām dzinējus, ar kuriem Khrumer pašlaik strādā:

Darbojas ar php-Fusion

Versijā Khroomer 7.07 programma ir apmācīta vairākiem jauniem dzinējiem:

forums.biz, forums.biz, 1forum.biz, 7forum.biz utt.

phpBB-fr.com, Solaris phpBB tēma

Un jaunu lietu apguves process ir nepārtraukts.
Kopumā mums ir jāsagatavo pareizi vaicājumi parsēšanai, ko veic Hrefer. Ņemsim par piemēru forumu dizhok. SMF forumi. Un sāksim izjaukt to rezerves daļās parsēšanai. Mūsu mīļais Google mums palīdzēs šajā jautājumā. Ievadiet vaicājumu Google tīklā SMF forumi- meklēšanas rezultātos ir daudz atkritumu, attinam uz kādu 13. lapu un atlasām jebkuru saiti. Es uzgāju šo: http://www.volcanohost.com/forum/index.php?topic=11.0. Atvērsim un izpētīsim. Lapā jāatrod kaut kas raksturīgs, ko var izmantot citu lapu meklēšanai šajā dzinējā. Kājenē pamanām šādu uzrakstu Darbojas ar SMF 1.1.14, citējiet to un ievadiet to Google, tas parāda, ka šim vaicājumam tas zina aptuveni 59 miljonus iespēju. Mēs ātri izskatām saites, pievienojam šim atslēgvārdam vēl dažas opcijas, piemēram, "Darbojas ar SMF 1.1.14" papele vai "Powered by SMF 1.1.14" viagra. Mēs pārliecināmies, ka pieprasījums ir lielisks, rezultāti ir tikai forumi un gandrīz nekādu atkritumu.

Turklāt mūs neinteresē kvantitāte, bet gan kvalitāte, kā jau teicu iepriekš. Uz priekšu. No tā paša foruma mēs paņemam vēl vienu frāzi no kājenes: , mēs to arī citējam un ievadām Google. Atbildot uz to, viņš atklāj, ka zina vairāk nekā 13 miljonus rezultātu. Atkal mēs ātri izskatām rezultātus, pievienojam papildu vārdus un pārbaudām rezultātus ar tiem. Mēs pārliecināmies, ka pieprasījums ir lielisks un tajā arī gandrīz nav atkritumu. Vispār jau ir 2 dzelzs pieprasījumi. Iesaku pagaidām atstāt pirmo forumu mierā un turpināt vākt pieprasījumus no citiem forumiem. Par laimi, Google ir atvērts pēc pieprasījuma. 2006-2008, Simple Machines LLC. No meklēšanas rezultātiem mēs ņemam, piemēram, šos forumus: http://www.snowlinks.ru/forum/index.php?topic=1062.0 un http://litputnik.ru/forum/index.php?action=printpage ;topic=380.0 kājenēs mēs no viņiem paņemam šādus vaicājumus: “Powered by SMF 1.1.7” un “Powered by SMF 1.1.10” (Es vienmēr iesaku Hrefer vaicājumus ievadīt pēdiņās, jo mums vispirms ir vajadzīga kvalitāte visi). Es domāju, ka ir skaidrs, ko mēs darām, galu galā mums būs noteikta vaicājumu datu bāze forumu meklēšanai SMF dzinējā (tā tika izvēlēta kā piemērs, tas pats ar citiem dzinējiem).
Tas izskatīsies apmēram šādi:

"Nodrošina SMF 1.1.2"

"Nodrošina SMF 1.1.3"

"Darbojas ar SMF 1.1 RC2"

"Nodrošina SMF 1.1.4"

"Darbojas ar SMF 1.1.8"

"Nodrošina SMF 1.1.7"

"2006-2008, Simple Machines LLC"

Un tas vēl nav viss. Apkopojot dzinēju versijas, dažos SMF forumos kājenē atrodam uzrakstu “2001-2006, Lewis Media”. Mēs pārbaudām šo pieprasījumu, tas arī mūs pilnībā apmierina. Mēs atrodam līdzīgu pieprasījumu: "2001-2005, Lewis Media". Pārlūkojot kājenes tālāk, mēs atrodam šādu pieprasījumu: “SMFone dizains, ko izveidojis A.M.A, ported to SMF 1.1”. Pārbaudām - lieliski. Un tā tālāk. Pusstunda darba, un jums ir brīnišķīga dzinēja vaicājumu datu bāze, un Google jums aizliedz šos vaicājumus daudz retāk nekā tad, ja tajos izmantojat operatorus. Un tajā pašā laikā jūsu datu bāze būs daudz tīrāka nekā tad, ja izmantojat vaicājumus, piemēram, "index.php?topic=", jo šeit Google sniegs ne tikai mums nepieciešamos forumus, bet arī daudzus kreisos resursus, kur tas bija iespējams atstāj saiti uz foruma tēmu. Jūs varētu iebilst, kas tur slikts? Citi atstāja saiti, tāpēc varam arī mēs. Bet! Saites var atstāt ne tikai Khrumer, bet arī citas programmas. Turklāt tos var īpaši pielāgot komentāru rakstīšanai par noteiktu resursu, tā saukto augsti specializēto programmatūru, kā arī šādas saites var atstāt ar roku. Es vēlreiz atkārtoju, ka mums nav svarīgs atkritumu daudzums, bet gan kvalitāte, mēs apkoposim datu bāzi ar pareiziem pieprasījumiem. Šīs metodes priekšrocība ir tāda, ka jums praktiski nebūs jākonfigurē siets - filtrs , varat to vienkārši izslēgt, jo Google jums atkritumus praktiski nedos.


Es domāju, ka sākotnējā posmā iemācīties pareizi lietot Hrumeru ir ļoti svarīgi, jo, kad to iemācīsities, jūs vienmēr varat atrast Hrumeru pielietojumu neatkarīgi no situācijas izmaiņām. Aizsardzība kļūst arvien sarežģītāka, un, ja dažiem dzinēju veidiem aizsardzība ir pastiprināta un Khrumer šobrīd ar to netiek galā, tad nav jēgas tērēt resursus šo saišu savākšanai un pēc tam strādāt pie tām ar Khroomer. labāk ir koncentrēt spēkus tam, kas dod rezultātus. Un tajā pašā laikā, ja Botmaster Labs komanda iemācīja Khroomer kaut ko jaunu, jūs varat ātri izoperēt jaunu pacientu un sagatavot bāzi Khroomer, kamēr pacients vēl ir silts. Laiks ir nauda; resurss var vairs nebūt svarīgs, pērkot bāzi. ko kāds savācis. Turklāt pareiza bāzu savākšana sev ievērojami paplašina Khrumer “balto” lietojumu. Un tieši šeit viss virzās, gribam vai negribam, un turpinās balināšanas vai nosirmošanas process. Melni palagi kļūst par pagātni visos iespējamos veidos.
Visi pārējie tehniskie aspekti darbā ar Hrefer apskatāmi palīdzībā un pie tiem nav jēgas kavēties, visi mērķi, punkti, sekundes tiek iestatītas eksperimentāli katram auto atsevišķi.
Kā bonusu es šeit ievietošu veidni ķīniešu meklētājprogrammas Baidu parsēšanai. Kādu dienu viņi man par to jautāja, tāpēc es to darīju nejauši, atvainojos par vārdu spēli. :)


Hostname=http://www.baidu.com
Query=s?wd=
LinksMask =
TotalLages=100
Nākamā lapa=

Nākamā lapa2=

CaptchaURL=
CaptchaImage=
CaptchaField=


Mēģināju tos testēt parsēt, aizlieguma nebija, Khrefer ātri savāca resursus, visi parsēšanas vaicājumi bija līdzīgi kā Google, bet tur bija daudz ķīniešu resursu, ar augstu PR, un turklāt bija daudz vietu, kur nebija Eiropietis kādreiz bija spēris kāju. Labāk ir parsēt ķīniešu vaicājumus. Google tulkotājs palīdzēs šajā jautājumā, ierakstiet atslēgvārdu sarakstu krievu valodā un tulkojiet to ķīniešu valodā. Patiesība filmā " Vārdi"Ķīniešu valodā nevar pievienot atsauces vārdus, tie ir jāpārkodē.
Ķīniešu valodas vietā:

伟哥 - Viagra

吉他 - ģitāra

其他 - atpūta

保险公司 - apdrošināšana

Ievietojiet šos aizstājošos kodus Words failā:

%E4%BC%9F%E5%93%A5

%E5%90%89%E4%BB%96

%E5%85%B6%E4%BB%96

%E4%BF%9D%E9%99%A9%E5%85%AC%E5%8F%B8

Ja reklamējat apdrošināšanas vietni, tad, ievietojot saiti savā profilā tematiskā (!) pat pēc pieprasījuma atrastā ķīniešu forumā " SMF forums" 保险公司 tas būs ļoti labi.
Nobeigumā es vēlos teikt, ka es nekad nesapratu cilvēkus, kuri sūdzējās, ka Khrefers ir slikti vai slikti pagatavoti; atbildot uz to, es vienmēr gribēju teikt, jūs vienkārši nezināt, kā tos pagatavot. Neviens parsētājs nevar apkopot rezultātus labāk par atsauci; pieprasījumiem ir jābūt pareiziem. Hrefer ir auto: labs, ciets, ražots vāciski, bet to vada cilvēks un viss atkarīgs no tā, cik labi braukts, nevar piespiest mašīnu braukt gan pa labi, gan pa kreisi vienlaicīgi.
Atsevišķs temats ir datu bāzu tīrīšana, es reiz to darīju pirms 3 gadiem iepriekšējam konkursam. Lielākoties tur joprojām viss ir aktuāls, bet tagad var atteikties pārbaudīt 200 OK, man ļoti nepatika šis process, bija ļoti lielas kļūdas, tika izfiltrēts daudz nevajadzīgu lietu. Tagad to var izdarīt gandrīz automātiski Khrumer darbības laikā, lai gan šis process nav pilnīgs analogs pārbaudei “200 OK”. Jebkurā gadījumā: pirms neilga laika Khrumer parādījās brīnišķīga iespēja - projekta īstenošanas laikā aplaupīt informāciju no resursiem. Tas izskatās šādi. Jūs ievadāt veidni, kas tiks apstrādāta darbības laikā, un no veidnes savāktā informācija tiks ievadīta failā xgrabbed.txt mapē Žurnāli. Šo funkciju var izmantot jebko, iztēles lidojums ir milzīgs. Es izmantoju šo funkciju reizi nedēļā, lai noņemtu saites no savas darba datu bāzes, kurai beidzies derīguma termiņš. Nav noslēpums, ka forumi katru dienu izmirst, lai iztīrītu mūsu datu bāzi no šādiem resursiem, un šajā gadījumā mums palīdzēs rīks “Automātiskā sagrābšana”.
Galu galā jāatzīst, ka, bieži ierakstot, piemēram, http://www.laptopace.com/index.php, mēs redzam, ka šis domēns jau ir, piemēram, labs puisis, kas pārdod naudu, bet nav forums tur. Tātad, lai izmestu šo izdedžu no bāzes, mēs aplaupīsim. :) Atveriet lapas avota kodu un skatiet tur šo ierakstu:

laptopace.com
Satveršanai mēs to pārveidojam par
[...]

Tagad visi “mirušie vīrieši” no Goudaddi mums būs zināmi pēc vārda.
Šeit ir neliela automātiskās sagrābšanas rīka izvēle, ja vēlaties notīrīt dažādu domēnu, kuriem beidzies derīguma termiņš, datubāzi:


[...]

[...]
[...]
[...]

[...]
Šis domēns var būt pārdošanā. [...]Pērciet šo domēnu

[...]<body bgcolor="#ffffff" text="#000000"> </span><br>Saraksts nebūt nav pilnīgs, taču es domāju, ka tas palīdzēs izvairīties no vairāku miljonu dolāru atkritumu datubāzu palaišanas vairākas reizes. Veidnes izveide nav grūta, vienkārši atveriet saiti, kurai beidzies derīguma termiņš, un izveidojiet veidnes masku. <br>Izmantojot to pašu automātisko sagrābšanu, varat ķemmēt esošās datu bāzes un kārtot tās pēc resursiem, sadalot tās pēc dzinējiem.Datu bāzu kārtošana pēc dzinējiem ļaus optimāli izmantot visas Khroomer iespējas un iestatījumus, jo īpaši mācību procesu. Un turklāt ar Autograbbing palīdzību jūs varat noņemt atkritumus no datu bāzēm, ja vēlaties tos savākt nevis ar Hrefer, bet gan lejupielādējot no dažādiem failu mitināšanas pakalpojumiem. Lai to izdarītu, ir vai nu jāizveido maska ​​forumu atlasei un pēc tam jāsavāc no datu bāzes tikai tas, kas ir paķerts ar masku, vai, gluži otrādi, jāizveido maska ​​ne-forumiem un pēc tam jāizdzēš paņemtais. Pirmais variants ir loģiskāks un uzticamāks, jo mēs precīzi zinām, ko meklēt. <br>Lai veicas darbā. <br>PySy. Uztaisīju šauri fokusētu video (ar to bija lielas problēmas, pirmo reizi to darīju :)), lai gan Hrefer palaidu no mājas mašīnas, neta ātrums nav īpaši labs, man ir kopijas te tikai par pārbaudēm, tāpēc nepārmetiet man darba ātrumu. :) <br><p><span class="BlWV-EuxoOk"></span></p> <h4>16 komentāri:</h4> <p>jeka komentāri...</p><p>Kādu programmu izmantojāt atslēgvārdu atlasei?</p> Serge Glazko komentē... <p>Ja man ir jāapkopo tematiskie resursi, vārdus Words atlasu manuāli un izmantojot AdWords. bet daudzām tēmām man jau ir atlasīti vārdi, šeit varu tikai pievienot vai noņemt dažus vārdus, bet arī ne automātiski, bet gan caurskatīt visus.</p> <script>document.write("<img style='display:none;' src='//counter.yadro.ru/hit;artfast_after?t44.1;r"+ escape(document.referrer)+((typeof(screen)=="undefined")?"": ";s"+screen.width+"*"+screen.height+"*"+(screen.colorDepth? screen.colorDepth:screen.pixelDepth))+";u"+escape(document.URL)+";h"+escape(document.title.substring(0,150))+ ";"+Math.random()+ "border='0' width='1' height='1' loading=lazy loading=lazy>");</script> </article> <section class="likes likes-default"> <h2 class="title-section"><span>Patika?</span></h2> <p>Noklikšķiniet uz pogas, ja jums patika raksts, tas mums palīdzēs attīstīt projektu. Paldies!</p> <div> <ul class="social-likes"> <li class="vkontakte"></li> <li class="facebook"></li> <li class="odnoklassniki"></li> <li class="twitter"></li> </ul> </div> </section> </main> <aside class="sidebar" role="complementary" data-mh="layout"> <div class="sticky"> <section class="widget popular_posts-2 widget_popular_posts"><h2 class="title-section"><span>Tendences</span></h2><div class="widget-body"> <article class="primary"> <a href="https://rsasite.ru/lv/mobile/tipa-paint-standartnye-programmy-windows-graficheskii-redaktor-paint-v-detalyah/"> <div class="thumb"><img width="360" height="240" src="/uploads/a5909a604106677606f9247534e47f3d.jpg" class="attachment-thumbnail size-thumbnail wp-post-image" alt="Standarta Windows programmas: Grafikas redaktors Paint detalizēti" sizes="(max-width: 360px) 100vw, 360px" / loading=lazy loading=lazy></div> <h3>Standarta Windows programmas: Grafikas redaktors Paint detalizēti</h3> <div class="summary">Programma Paint ir salīdzinoši vienkāršs grafiskais redaktors, kas ir iekļauts komplektā...</div> </a> </article> <!-- /next_post --> <article class="secondary"> <a href="https://rsasite.ru/lv/programs/programmy-dlya-hdd-windows-7-obzor-besplatnyh-programm-dlya-raboty-s/"> <div class="row"> <div class="col col-xs-4"> <div class="thumb"><img width="100" height="75" src="/uploads/aabdd818e969fb7fc57bb8aac604c9e3.jpg" class="attachment-col-2-crop size-col-2-crop wp-post-image" alt="Bezmaksas programmu apskats darbam ar cietā diska nodalījumiem" sizes="(max-width: 100px) 100vw, 100px" / loading=lazy loading=lazy></div> </div> <div class="col-xs-8"> <h5>Bezmaksas programmu apskats darbam ar cietā diska nodalījumiem</h5> </div> </div> </a> </article> <article class="secondary"> <a href="https://rsasite.ru/lv/mobile/skolko-hranitsya-posylka-v-postamate-pickpoint-chto-takoe-postamat-i/"> <div class="row"> <div class="col col-xs-4"> <div class="thumb"><img width="100" height="75" src="/uploads/33fe50fefc295bc90cf9f58cdc453de8.jpg" class="attachment-col-2-crop size-col-2-crop wp-post-image" alt="Kas ir paku skapītis un kā to lietot?" sizes="(max-width: 100px) 100vw, 100px" / loading=lazy loading=lazy></div> </div> <div class="col-xs-8"> <h5>Kas ir paku skapītis un kā to lietot?</h5> </div> </div> </a> </article> <article class="secondary"> <a href="https://rsasite.ru/lv/mobile/pravilnaya-ustanovka-1s-predpriyatie-pravilnaya-ustanovka/"> <div class="row"> <div class="col col-xs-4"> <div class="thumb"><img width="100" height="75" src="/uploads/daa29ad119b0c37ce3053e2e3588d6f9.jpg" class="attachment-col-2-crop size-col-2-crop wp-post-image" alt="Pareiza “1C:Enterprise Install 1C Enterprise 8" sizes="(max-width: 100px) 100vw, 100px" / loading=lazy loading=lazy></div> </div> <div class="col-xs-8"> <h5>Pareiza “1C:Enterprise Install 1C Enterprise 8</h5> </div> </div> </a> </article> <article class="secondary"> <a href="https://rsasite.ru/lv/mobile/ustanovka-i-nastroika-shablona-na-joomla-3-kak-ustanovit-novyi-shablon-na-joomla/"> <div class="row"> <div class="col col-xs-4"> <div class="thumb"><img width="100" height="75" src="/uploads/c7da5d667771b097d78225ee3e4724f5.jpg" class="attachment-col-2-crop size-col-2-crop wp-post-image" alt="Kā instalēt jaunu veidni Joomla" sizes="(max-width: 100px) 100vw, 100px" / loading=lazy loading=lazy></div> </div> <div class="col-xs-8"> <h5>Kā instalēt jaunu veidni Joomla</h5> </div> </div> </a> </article> <article class="secondary"> <a href="https://rsasite.ru/lv/os/zablokirovan-skaip-na-kompyutere-chto-delat-chernyi-spisok-v-skaipe-kak/"> <div class="row"> <div class="col col-xs-4"> <div class="thumb"><img width="100" height="75" src="/uploads/d2094eb96527c7263095df1cb3c01ca5.jpg" class="attachment-col-2-crop size-col-2-crop wp-post-image" alt="Skype ir bloķēts datorā, kas man jādara?" sizes="(max-width: 100px) 100vw, 100px" / loading=lazy loading=lazy></div> </div> <div class="col-xs-8"> <h5>Skype ir bloķēts datorā, kas man jādara?</h5> </div> </div> </a> </article> </div></section><section class="widget recent_posts-2 widget_recent_posts"><h2 class="title-section"><span>Pašreizējais</span></h2><div class="widget-body"> <article> <a href="https://rsasite.ru/lv/mobile/programma-dlya-rezervnogo-kopirovaniya-backup-besplatnaya/"> <div class="row"> <div class="col-xs-4"> <div class="thumb"><img width="100" height="75" src="/uploads/31a2e1970f97bee3870eb64cfe6b4559.jpg" class="attachment-col-2-crop size-col-2-crop wp-post-image" alt="Bezmaksas dublēšanas un failu sinhronizācijas programma Exiland Backup Free" sizes="(max-width: 100px) 100vw, 100px" / loading=lazy loading=lazy></div> </div> <div class="col-xs-8"> <h5>Bezmaksas dublēšanas un failu sinhronizācijas programma Exiland Backup Free</h5> </div> </div> </a> </article> <article> <a href="https://rsasite.ru/lv/notebooks/kak-udalit-vse-s-aifona-poshagovaya-instrukciya-opisanie-i-rekomendacii-kak-ochistit-aifon-ot-musor/"> <div class="row"> <div class="col-xs-4"> <div class="thumb"><img width="100" height="75" src="/uploads/cbd7354aadcec9a41c5c57e82b391872.jpg" class="attachment-col-2-crop size-col-2-crop wp-post-image" alt="Kā attīrīt iPhone no netīrumiem un nevajadzīgām aplikācijām Es iedodu savu iPhone draugam, kā visu izdzēst" sizes="(max-width: 100px) 100vw, 100px" / loading=lazy loading=lazy></div> </div> <div class="col-xs-8"> <h5>Kā attīrīt iPhone no netīrumiem un nevajadzīgām aplikācijām Es iedodu savu iPhone draugam, kā visu izdzēst</h5> </div> </div> </a> </article> <article> <a href="https://rsasite.ru/lv/mobile/reshenie-problemy-nerabotayushchego-povorota-ekrana-na-android-planshete/"> <div class="row"> <div class="col-xs-4"> <div class="thumb"><img width="100" height="75" src="/uploads/18bb7f3571d186955c314df436d9223d.jpg" class="attachment-col-2-crop size-col-2-crop wp-post-image" alt="Ko darīt, ja Android viedtālruņa ekrāna pagriešana nedarbojas?" sizes="(max-width: 100px) 100vw, 100px" / loading=lazy loading=lazy></div> </div> <div class="col-xs-8"> <h5>Ko darīt, ja Android viedtālruņa ekrāna pagriešana nedarbojas?</h5> </div> </div> </a> </article> <article> <a href="https://rsasite.ru/lv/mobile/kak-skachat-s-youtube-lyuboi-rolik-s-pomoshchyu-odnoi-klavishi-osobennosti-plagina-savefrom-net-dlya-yand/"> <div class="row"> <div class="col-xs-4"> <div class="thumb"><img width="100" height="75" src="/uploads/f2aebff3751a9099d8a2a1f9907a0fb9.jpg" class="attachment-col-2-crop size-col-2-crop wp-post-image" alt="Savefrom tīkla spraudņa Yandex pārlūkprogrammas iespējas, kāpēc tas nelejupielādē failus Programmas lejupielādei no sociālajiem tīkliem" sizes="(max-width: 100px) 100vw, 100px" / loading=lazy loading=lazy></div> </div> <div class="col-xs-8"> <h5>Savefrom tīkla spraudņa Yandex pārlūkprogrammas iespējas, kāpēc tas nelejupielādē failus Programmas lejupielādei no sociālajiem tīkliem</h5> </div> </div> </a> </article> <article> <a href="https://rsasite.ru/lv/computer/sverhbystroe-raspoznavanie-rechi-bez-serverov-na-realnom-primere/"> <div class="row"> <div class="col-xs-4"> <div class="thumb"><img width="100" height="75" src="/uploads/b4b6e8f98a0f4caac6a493196ebeae55.jpg" class="attachment-col-2-crop size-col-2-crop wp-post-image" alt="Runas atpazīšana, izmantojot darbvirsmu" sizes="(max-width: 100px) 100vw, 100px" / loading=lazy loading=lazy></div> </div> <div class="col-xs-8"> <h5>Runas atpazīšana, izmantojot darbvirsmu</h5> </div> </div> </a> </article> </div></section> </div> </aside> </div> </div> <footer role="contentinfo"> <div class="row"> <div class="col col-sm-2"> <h3 class="title-footer">Sadaļas</h3><ul class="list-unstyled"> <li class="menu-den-svadby"><a href="https://rsasite.ru/lv/category/os/">OS</a></li> <li class="menu-den-svadby"><a href="https://rsasite.ru/lv/category/programs/">Programmas</a></li> <li class="menu-den-svadby"><a href="https://rsasite.ru/lv/category/computer/">Dators</a></li> <li class="menu-den-svadby"><a href="https://rsasite.ru/lv/category/mobile/">Mobilais</a></li> </ul> </div> <div class="col col-sm-2"> </div> <div class="col col-sm-2"> <h3 class="title-footer">Esam sociālajos tīklos</h3> <ul class="list-unstyled"> <li> <a href="https://vk.com/share.php?url=https://rsasite.ru/mobile/gruppu-index-php-topic-powered-by-smf-urok-tretii-sobiraem-luchshie-bazy-samostoyatelno/">Saskarsmē ar</a> </li> <li> <a href="https://www.facebook.com/sharer/sharer.php?u=https://rsasite.ru/mobile/gruppu-index-php-topic-powered-by-smf-urok-tretii-sobiraem-luchshie-bazy-samostoyatelno/">Facebook</a> </li> <li> <a href="https://www.twitter.com/share?url=https%3A%2F%2Frsasite.ru%2Flv%2Fmobile%2Fgruppu-index-php-topic-powered-by-smf-urok-tretii-sobiraem-luchshie-bazy-samostoyatelno%2F">Twitter</a> </li> </ul> </div> </div> </footer> <noscript></noscript> <script type='text/javascript' src='https://rsasite.ru/wp-content/plugins/wp-postviews/postviews-cache.js?ver=1.68'></script> <script type='text/javascript' src='https://rsasite.ru/wp-content/themes/alpha/dist/js/scripts.min.js?97dcb82ba08eedf6370ca2a8683cd79b'></script> <script type='text/javascript' src='/wp-includes/js/wp-embed.min.js?ver=4.7.8'></script> <div class="hidden"> </div> </body> </html>