Ostatnio na forum PiO przeczytałem, że era kopii wikipedii się kończy
Dziwne, bo mi jeszcze ani jedna nie poleciała, a dotego stawiam ciągle nowe kopie, które staram się różnicować - zresztą wszystko opisałem w poście na temat Wikipedii.
Dzisiaj pod wpływem impulsu postanowiłem całkowicie przerobić skrypt - tzn dodałem sekcję - <html>, <head>, <body> i dodałem doctypa. Oprócz tego pobawiłem się z formatowaniem i rozdzieliłem stopkę z własnymi linkami od sekcji przygotowanej pod systemy, którą nazwałem “Pomocne linki”
Następnie pokolorowałem troszkę to co powstało, ponadawałem style i pousuwałem część rzeczy - jak szukajka i oryginalne formatowanie.
Może nie wyszło z tego arcydzieło, ale patrzy się na to przyjemniej niż na czystą kopię. Dotego jestem prawie pewny, że algorytmem bardzo ciężko będzie znaleźć taką kopię - chyba, że zaczęto by porównywać nazwy klas (które można przepisać podczas grabienia contentu). Nie wierzę za bardzo w Duplicate Content, więc tym się nie przejmuję.
Wierzę za to w bany ręczne i wydaje mi się, że teraz taka kopia nie wygląda do końca jak kopia i może uciec z pod palca pracownika google - wejdzie zobaczy, nie skojarzy i sobie pójdzie - takie banowanie ręczne to musi być strasznie nudna robota, więc liczę na szczęście jak już mnie takowy pracownik odwiedzi.
Stawianie kopii tego skryptu (jak i oryginalnego) zaczynam od zmian większości rzeczy które są wpisane na sztywno w kodzie - właśnie po to, żeby było trudniej odnaleźć go jakimś algorytmem. Największą bolączką skryptów takich jak qlweb jest to, że dostał się w za dużą liczbę rąk - przez co większość kopii jest identyczna i bardzo łatwa do namierzenia. Teraz mój skrypt różni się jeszcze bardziej od tysięcy kopii wikipedii, więc wierzę w jego przetrwanie na fali ostatnich wyindexowań.
Przy okazji - przez przypadek pod linkami z systemów zrobiło się całkiem sporo miejsca na jakiś własny text z linkiem w treści
- nie dość, że link teoretycznie będzie miał większą moc to dotego moja kopia znowu czymś się będzie różniła od innych.
A więc skoro już tyle się napisałem to wrzucam linka do Cutomviki w subdomenie spam-factory. Będę na bierząco śledził jej indexację i uzupełniał tego posta.
Myślę również nad dodaniem do takiej kopii czytnika RSS i losowarki dla dodatkowych textów z linkami
Niedawno zrobiłem podmienianie słów z artykułów na linki, ale muszę ten mechanizm dopracować, bo podmienia nawet słowa zawarte w jakimś linku na nowy link - nie wiem jak na takie coś patrzy google :P
EDIT:
Dzisiaj tj. 27/05/2008 zaindeksowało mi już ponad 500 stron. Dodatkowo za komentarzem Zen Vantalye usunąłem linki edycji z customviki
- Superviki - czyli kolejne podejście do kopii Wiki
- megaViki - kolejna Wiki w moim wydaniu
- Kopia wikipedii u siebie ?
- UltraViki - chyba ostatnia próba z wiki.
- Spamer spamerowi spamerem? ;)


By Bielack on May 21, 2008
Fajne, podoba mi się Twoja przeróbka. Ja też (rzecz jasna) mam kilka Wiki i tymczasem trzymaja się mocno - jak te chińczyki. Ale ja też zrobiłem sobie własny szablon, może nie tak drastyczny jak ten Twój, ale jednak. Trzeba przyznać, że ten oczojebny żółty sprawia, że przestajesz się przyglądać cóż to za skrypt…
By admin on May 22, 2008
Mam taką nadzieję, że jednak kolory odwracają uwagę i dzięki temu wygląda to jak normalna strona
By Zen Vantalye on May 22, 2008
Ja bym proponował usunąć linki typu:
http://pl.wikipedia.org/w/index.php?title=2008&action=edit§ion=10 gdyż dzięki nimi można łatwo nawet automatem zdobyć listę kilkuset kopii wikipedii i tylko sprawdzić czy zawierają określone słowa.
By admin on May 22, 2008
Myślałem o tym - na początku chciałem je ukryć CSSem (dispay: none), ale to by znowu była ukryta treść i linki - czyli można dostać po łapach
Pozatym w kodzie linki by nadal istniały - spróbuję coś na to poradzić
By mirek on May 22, 2008
witam, mnie chyba poszla wiki robiona na tym poprzednim skrypcie co pokazywales
dorobilem tak jak tutaj piszesz sekcje <head>, mialem keywordsy, description, ladny design, ogolnie cala encyklopedia byla "wpleciona" w tematyczna strone (motoryzacja), ladnie sie indeksowalo, ale od 2 tygodnia mam site=0 i w ogole nie ma zadnych stron w indexie 
By mirek on May 22, 2008
mam jedna prosbe tylko do Ciebie, czy moglbys mi napisac jak zrobiles z title ze nie masz "odstepu" na poczatku? nie wiem jak to wytlumaczyc hehehehe ofcoz jesli bazujesz na poprzednim, skrypcie (tym z vacilando.org) to powineiens wiedziec co mam na mysli - chodzi o to, ze zrobiles cos takiego, ze w title jest najpierw nazwa hasla + jakis staly teskt, ale na poczatku jak sie odpala to nie ma zadnego hasla i w title mam "spacja" + jakis staly tekst - ewentulanie napisz mi na priv jakis kontakt do siebie to wytlumacze, pokaze to co mi wypadlo z indexu
By admin on May 22, 2008
Widocznie pech Cię spotkał i dlatego wyindexowało
- zdarza się - postawi parę nowych kopii
A co do drugiego pytania.
Jeśli Ci to przeszkadza to trzeba by było wstawić if sprawdzającego czy title jest puste i wtedy nie wstawiać spacji - u mnie też jest spacja - jakoś specjalnie mi to nie przeszkadza
By mirek on May 22, 2008
w sumie fakt, spacja to maly problem
a co do pecha to mialem tylko te jedna wiki - tak testowo posatwilem hehehehe, w sumie caly serwis i tak ma wiecej wejsc z yahoo niz z google (serwis jest anglojezyczny) wiec "walic" google
By Sebastian on May 28, 2008
Jak pozbyłeś się "edycji" odsyłającej do oryginalnej Wikipedii? Domyślam się, że zmieniłeś coś przy zmiennej buffer - tylko co i jak?
By admin on May 28, 2008
Użyłem wyrażeń regularnych i funkcji preg_replace właśnie na $buffer - muszę to jeszcze dopracować troszkę, bo niekiedy za dużo zjada :P
By Sebastian on May 28, 2008
Podzieliłbyś się kodem? Programowanie nie jest moją mocną stroną.
By Bielack on Jun 6, 2008
Patrz, że tamta poszła - a ta, mocniej przerobiona została. Własna, mocna przeróbka kluczem do sukcesu ?
By admin on Jun 9, 2008
Całkiem możliwe - stare kopie wiki podmieniłem na te nowe i zobaczymy czy uda mi się zaindexować podnownie te spamy - czasy się zmieniają to i narzędzia muszą za nimi nadążać.
By Wielebny on Jun 14, 2008
Google mocno czyści bazy z kopii wiki, pierwsza fale banow przetrwaly moje kopie, ale ostatnia fala - 2 b. stare domeny dostaly bany (mimo, ze niektore subdomeny wartosciowe.
Jak widze, bardziej fikusne wiki tez leca:
http://www.google.pl/search?q=site:http://www.customviki.spam-factory.eu/
By Bielack on Jun 15, 2008
Bieda z wikiami - ładnie się indeksowały, ale lecą teraz potwornie. Widzę, że ta mocno przerobiona też poleciała?
By admin on Jun 16, 2008
No niestety
Trzeba znowu wymyśleć coś innego - szczególnie, że e-weblink namieszał z oceną stron 