Skocz do treści, sidebara lub stopki

Ta notka zainspirowana została wpisem Livio na temat kradzieży wpisów.

jogger

Wiele jest serwisów w sieci, które niekoniecznie za naszą zgodą pobierają sobie treści z naszych joggerów wpadłem na pomysł zabezpieczenia antyhotlinkowego. Wordpress ma swoje wtyczki, a na joggerze takiego ficzera nie poużywamy.

Kto jest za?

Jeszcze nie wiem jak to dokładnie miałoby to wyglądać, ale zapewne wszystko współpracowałoby z RSS, tylko co wtedy z serwisami typu Feedburner... Może macie jakieś swoje propozycje? Może sparrow tu zajrzy i nas poczyta ;-)

Komentarze do wpisu "Zabezpieczenie antyhotlinkowe z serwerów joggera":

1. BTM napisał(a):
05 kwietnia 2008, 20:31:01

Nie wiem o jakich wtyczkach do WP mówisz, ale hotlinkowanie to co innego. Hotlinkowanie to np. wstawianie na swojej stronie obrazków z Twojej strony – ni jak ma się to do kopiowania tekstów – zabezpieczenie przed czymś takim jest nie do wykonania ZTCW.

2. Susek napisał(a):
05 kwietnia 2008, 20:34:13

Treści to i obrazki, i tekst. ;-)

btw O mówiłem o tego typu wtyczkach – http://www.wp-plugins-db.org/plugin/antileech/ i http://en.forums.wordpress.com/topic.php?id=13366

3. Chris Trynkiewicz napisał(a):
05 kwietnia 2008, 20:36:06

Jakie hotlinkowanie masz na mysli?
Bo domyslnie, jest to wlasnie to, co BTM napisal: niemoznosc wyswietlania obrazkow z zewnetrznych serwerow.
Sensu to nie ma najmniejszego, bo jesli ktos ma obrazki u siebie we wpisach, to trzyma je na innych serwerach (flickr itp. – jogger ma mala pojemnosc, tylko na garfe stala do strony).
Natomiast kopiowaniu tekstu sie nie da zapobiec w taki sposob.

4. btm napisał(a):
05 kwietnia 2008, 20:36:56

@Susek: ale to nie jest nic nowego poza banowanie IP osób, które kradną Ci teksty – bo czy im zbanujesz IP, czy będzies wysyłać spreparowane teksty – jeden diabeł.

5. Chris Trynkiewicz napisał(a):
05 kwietnia 2008, 20:38:09

Przeciez kazdy domorosly spammer ustawia User-agenta dla swojego bota, jesli go posiada. A banowanie IP juz jest.

6. Susek napisał(a):
05 kwietnia 2008, 20:41:34

No właśnie chodzi mi o to, żeby to jakoś miło i przyjemnie sforsować. Banowanie IP to średni pomysł. Zdecydowanie bardziej odpowiednie byłyby black- i whitelisty domen na których wpisy mogą lądować.

7. btm napisał(a):
05 kwietnia 2008, 20:42:28

No to banowanie = blacklista? :>
Whitelista to co innego, ale z drugiej strony – będziesz autoryzował każdemu użytkownikowi RSS’a dla jego IP? :>

8. Susek napisał(a):
05 kwietnia 2008, 20:44:29

@ btm – masz rację, to też głupie :p ale musi być jakiś dobry sposób na wytępienie niechcianych podbieraczy wpisów…

9. Livio napisał(a):
05 kwietnia 2008, 21:13:53

Ja, co oczywiste, jestem za, ale z umożliwieniem ZGODY na „podbieranie”.

10. Michał _kUtek_ Kuciński napisał(a):
05 kwietnia 2008, 21:15:13

Kopiowania treści nie da się zablokować od tak. :P
Wystarczy tylko dostęp do robots.txt i ręczne blokowanie botów.

11. Livio napisał(a):
05 kwietnia 2008, 21:15:41

Ale „jakoś tam” się da…

12. Michał _kUtek_ Kuciński napisał(a):
05 kwietnia 2008, 21:16:46

No na uprtego można zablokować wszystkie roboty prócz góglowskich czy tam yahoowskich. :P

13. Susek napisał(a):
05 kwietnia 2008, 21:18:17

@ kutek – kolejny fajny pomysł. Lista botów, które możemy wybierać według własnych preferencji. ;-)

14. Chris Trynkiewicz napisał(a):
05 kwietnia 2008, 21:18:26

Sorry, ale o czym wy gadacie?
Myslicie, ze to problem, ustawic user-agenta na Googlebot?
Jak macie az taka wazna tresc, to zrobcie sobie captcha przy ladowaniu kazdej strony. Inaczej dyskusja jest bezcelowa…

15. Livio napisał(a):
05 kwietnia 2008, 21:19:08

Sorry, ale nie chcę, by bez mojej wiedzy boty podbierały mi treść.

16. Michał _kUtek_ Kuciński napisał(a):
05 kwietnia 2008, 21:19:12

Chris, ale jeżeli jakiś spamer podmieni sobie UA na google bota, tylko dlatego, żeby zabrać wpisy, to chyba już mozna wyciągnąć z tego jakieś konsekwencje, nie?

17. Susek napisał(a):
05 kwietnia 2008, 21:19:19

@ eldoras – my po prostu rozważamy różne opcje. każdy może rzucić swoją do przedyskutowania ;-)

18. Chris Trynkiewicz napisał(a):
05 kwietnia 2008, 21:21:14

@Michał: Będziesz kogoś gonił po jego IP przez proxy azjatyckie, żeby pozwać do sądu o podszywanie się pod Googlebota, co zresztą nie jest nielegalne afaik?

19. Susek napisał(a):
05 kwietnia 2008, 21:22:39

Panowie, zaraz nam się tutaj flamewar sypnie. Proszę, w komentarzach rozważajmy tylko i wyłącznie temat wpisu. Nie dochodźmy czy podszywanie się pod bota jest ok czy nie. Tutaj kombinujemy jak oszukać te boty ;-)

20. Livio napisał(a):
05 kwietnia 2008, 21:24:23

Chłopaki, Suskiem się nie przejmujcie… Bijcie się, będzie mięso :D .

21. Chris Trynkiewicz napisał(a):
05 kwietnia 2008, 21:25:04

Rozmowa jest konstruktywna, nie widze problemu :) No offence to anyone :)

22. Michał _kUtek_ Kuciński napisał(a):
05 kwietnia 2008, 21:25:14

Sprawa kombinowania schodzi na drugi plan, ważniejsze jest to, czy jeżeli zablokuję inne boty prócz G i ktoś to obejdzie podmieniając po prostu UA, to czy a) nie mogę zgłosić tego do samych Google lub po prostu napisać, że ma zaprzestać. Chociaż wygląda mi to na nierealne i masakrycznie pokręcone. Cóż.
Magiczne SEO i SEM o tym pisało też.
Yupp, ja też flame nie widzę.

23. Chris Trynkiewicz napisał(a):
05 kwietnia 2008, 21:30:10

(Komentarz zmodyfikowany 05.04.2008 o 21:32)

@Michał: Google ma takie rzeczy gdzies. Ostatnio mialem problem z wykradzionym wpisem, podalem wszelkie informacje o spamerze, powiazania, dane teleadresowe, screenshoty i URLe wraz z wyciagiem ze zlamanego regulaminu AdSense przez niego uzywanego.
Oto ich odpowiedz:

Google jest dostawcą informacji, a nie mediatorem. Dostarczamy reklamy kierowane na określone strony internetowe, ale nie kontrolujemy treści tych stron. W tego rodzaju sprawach najlepiej jest zwrócić się bezpośrednio do webmastera danej strony.

Tyle odnosnie interwencjonizmu Google :(

24. Michał _kUtek_ Kuciński napisał(a):
05 kwietnia 2008, 21:31:45

Wiadomo, że Google blokuje tylko to, co jest dla nich niewygodne. :] No ale cóż, zawsze warto próbować, a nuż się uda (przede wszystkim, nie można tego zostawić, jeżeli mowa o prawdziwym splogu, a nie biednym blognews.pl)

25. Chris Trynkiewicz napisał(a):
05 kwietnia 2008, 21:33:08

Chodzilo o siec splogow spamera uzywajacego wykopu w dodatku. Google nie zrobilo nic.

26. Michał _kUtek_ Kuciński napisał(a):
05 kwietnia 2008, 21:33:56

Serwer pewno też jakiś zagraniczny?

27. Susek napisał(a):
05 kwietnia 2008, 21:34:33

Wybaczcie, ale tak BTW jak znaleźliście splogi ze swoimi wpisami? Bardzo chętnie poznałbym Wasze metody, bo nie jestem pewny, ale pewnie ktoś i może mi podkradać wpisy…

28. Chris Trynkiewicz napisał(a):
05 kwietnia 2008, 21:34:42

Blogger, nalezacy do Google. Zajalem sie sprawa sam. Pana Leszka troche stepilem, juz nie spamuje ;)

29. Michał _kUtek_ Kuciński napisał(a):
05 kwietnia 2008, 21:35:33

Susek: http://www.copyscape.com/ i related: w google oraz ew. kopiowanie treści wpisu do gógla. ;-)

30. Chris Trynkiewicz napisał(a):
05 kwietnia 2008, 21:35:43

Mnie czytelnik poinformowal, ale pewnie by mozna napisac na szybkiego skrypt szukajacy w Google po tytule wpisu pobieranego z RSS.

31. Susek napisał(a):
05 kwietnia 2008, 21:36:49

@ kutek – dzięki za link ;) o related i kopiowaniu treści słyszałem. Myślałem, że są jakieś inne, hakierskie metody ;)

32. Livio napisał(a):
05 kwietnia 2008, 21:36:50

„http://www.copyscape.com/?results”:http://www.copyscape.com/?results

Jakiś jogger.pl podkrada mi wpisy! Zablokować szajstwo!

(;

33. Michał _kUtek_ Kuciński napisał(a):
05 kwietnia 2008, 21:37:41

No niestety dla dobrych wyników trza wykupić pro. ;-)

34. Susek napisał(a):
05 kwietnia 2008, 21:38:53

Wow, mnie wyjada blogfrog, jogger, blognews i to wszystko w TOP 10. Chyba nie chcę wiedzieć więcej ;-)

Skończmy offtop. Wróćmy do tematu.

35. Michał _kUtek_ Kuciński napisał(a):
05 kwietnia 2008, 21:39:45

Jestem za dostępem z PA do pliku robots.txt. Co prawda zabezpieczenie to takie, jak stosunek przerywany, ale zawsze. ;-) + kilka ficzerów

36. btm napisał(a):
05 kwietnia 2008, 21:40:47

A przepraszam, co – poza zablokowaniem wyszukiwarek które akceptują robots.txt – da Ci dostęp do niego?

37. Michał _kUtek_ Kuciński napisał(a):
05 kwietnia 2008, 21:41:19

No zasadniczo nic więcej, ale możemy sobie poblokować odpowiednie podstrony etc.

38. Susek napisał(a):
05 kwietnia 2008, 21:41:23

Mnie bardziej interesuje te kilka ficzerów. Możesz przybliżyć?

39. Michał _kUtek_ Kuciński napisał(a):
05 kwietnia 2008, 21:41:49

Oj skróciłem myśl no. :D

40. btm napisał(a):
05 kwietnia 2008, 21:42:24

Kutek: ale w ten sposób zablokujesz tylko te wyszukiwarki które akceptują robots.txt, nic więcej – nic mniej. Jak sobie napiszę skrypt kopiujący Twoją stronę / RSS to na pewno nie będzie on przestrzegał robots.txt

41. btm napisał(a):
05 kwietnia 2008, 21:42:39

Rozwiązaniem może być globalna, moderowana, banlista ;-)

42. Susek napisał(a):
05 kwietnia 2008, 21:43:39

Mamy kilka opcji

  • blacklist & whitelist
  • dostęp do robots.txt
  • coś przeciw hotlinkowaniu

Gdyby to połączyć, to wyjdzie całkiem przyjemna obrona przed splogami ;-)

43. Chris Trynkiewicz napisał(a):
05 kwietnia 2008, 21:43:46

Chcecie na sile… Mozna zrobic ajax, wczytujacy tresc dopiero po ruszeniu mysza przez uzytkownika. Albo po prostu po 0.1sec. Boty nie dzialaja jak przegladarki – powinno wystarczyc, by do botow nie byl przekazywany content.
Tyle, ze wciaz agenty podajace sie za Googleboty to obejda, bo im pozwolimy.
Moze VeriSign zacznie podpisywac UA? ;)

44. Chris Trynkiewicz napisał(a):
05 kwietnia 2008, 21:49:19

Albo nawet kodowac tresc do base64 i dekodowac JSem… Ale to wszystko takie kombinowanie i tak do obejscia, nawet jak sie posoli algorytmy. CAPTCHA or nothing else i tyle wg mnie.

45. Michał _kUtek_ Kuciński napisał(a):
05 kwietnia 2008, 21:50:25

Chris, że niby „Jeżeli chcesz zobaczyć treść, to przepisz obrazek”? Albo „jeżeli chcesz mnie subskrybować, to rozwiąż równanie”? ;-)

46. Chris Trynkiewicz napisał(a):
05 kwietnia 2008, 21:51:33

Tak. To jedyny pewny sposob. Ale CAPTCHA nie musi wymagac interwencji uzytkownika. Jak pisze, od biedy nawet JS moze emulowac usera, bowiem nie jest wykonywany przez boty z oczywistych wzgledow.

47. Michał _kUtek_ Kuciński napisał(a):
05 kwietnia 2008, 21:52:23

CAPTCHA też jest do obejścia. Jak dla mnie to panikujecie. :P

48. Susek napisał(a):
05 kwietnia 2008, 21:53:15

Czyli pozostaje nam się pogodzić z botami, splogami i tym całym siajstwem?

49. Chris Trynkiewicz napisał(a):
05 kwietnia 2008, 21:53:18

Tez uwazam to za triumf nadziei nad doswiadczeniem, ale skoro juz kolega chcial pomysly, to je daje ;)

50. Michał _kUtek_ Kuciński napisał(a):
05 kwietnia 2008, 21:55:03

Susek, ale dojdziemy do tego w końcu, że aby user dostał się do treści, będzie musiał rozwiązać test IQ, przepisać 3 CAPTCHA i klikać myszą w odpowiednich miejcach w odpowiednim czasie.. A splog można ścigać drogą prawną, jeżeli tylko łamie licencję.

51. Jiobel napisał(a):
05 kwietnia 2008, 21:56:02

Może po prostu przestańcie pisać, jak tak bardzo przeszkadza wam, że gdzieś można znaleźć wasze wpisy z linkami do bloga i info o autorze albo pogódźcie się z tym, że Internet to przede wszystkim dostęp do informacji. I walczcie ze złodziejami, którzy rzeczywiście kradną wpisy i zarabiają kaskę na reklamach.

O, a może to się wam spodoba – dostęp do wpisów tylko po wysłaniu SMSa. No ludzie, no… :-|

52. Chris Trynkiewicz napisał(a):
05 kwietnia 2008, 21:56:53

Teoretycznie mozna, Michale. Ja mam prokurature za sciana i nie chcialo mi sie sprawy zakladac, chociaz mialem dowody. Badzmy realistami – spamerzy sa gora. Podobnie zwyciezyli z projektem Blue-costam… Nie kojarze juz…

53. Michał _kUtek_ Kuciński napisał(a):
05 kwietnia 2008, 22:00:40

Chris, spamerzy zawsze będą górą, póki czegoś nie zrobimy. ;-) Warto zakładać sprawy, warto pisać do admina serwera i kłócić się o swoje.
Jiobel: owy blognews jest tylko inspiracją do tematu, równie dobrze można postawić w jego miejce adres jakiegoś prawdziwego sploga.

54. Chris Trynkiewicz napisał(a):
05 kwietnia 2008, 22:02:27

Michale, zgadzam sie. Prawda taka, ze zwyciezyc ze spamerami moze tylko Wielkie Google, czy Wielki MS (haha, dobra, tego po NICH nie oczekuje).
Ale Google nie ma jaj ;)

55. Jiobel napisał(a):
05 kwietnia 2008, 22:02:56

Ale jak można porównywać BN do jakiegoś spamera?! I wybacz Susek – ale co ten wpis ma wspólnego z Techblogiem?

Chris: Niebieska Żaba. I trochę nie rozumiem Twojego porównania do niechęci / lenistwa w sprawie złożenia zawiadomienia do prawdziwego zamknięcia owej. Przeczytaj sobie notatki Tonida w tej sprawie.

56. Livio napisał(a):
05 kwietnia 2008, 22:03:52

MS to na razie siedzi cicho… Ale wraz widać, że on chce Novella wykorzystać, żeby kiedyś nieświadomych twórców i użytkowników opensource przejąć... Zakrawa to na panikę, ale Mono to implementacja tworu MS, .NET.

57. puppy napisał(a):
05 kwietnia 2008, 22:04:51

Może trzeba założyć fundację, która by broniła praw autorskich wpisów na blogach.
O – mam pomysł! Niech przed wejściem na stronę wyskakuje popup z treścią licencji, po której zatwierdzeniu zostaniemy skierowani do quizu – sprawdzającego czy użytkownik licencję przeczytał. Dopiero wtedy kierujemy na właściwą stronę. Jak coś nie tak – blokada ip, lub jeszcze lepiej całej klasy ip.
<_<

58. Susek napisał(a):
05 kwietnia 2008, 22:05:17

@ Jiobel – z Techblogiem ma wspólne to, że rozważamy różne metody zatruwania spamu, ciążących splogów i tym podobne. Jeśli ten wpis nie przekazuje żadnych ciekawych treści mogę wycofać.

59. Chris Trynkiewicz napisał(a):
05 kwietnia 2008, 22:05:39

@Jiobel: Szybciej mi bylo zadzwonic do delikwenta i zapytac, czy ma ochote isc do sadu. W ciagu godziny wszystkie jego splogi zniknely z netu. A sprawe Zaby znam, tylko mi wyfrunela nazwa ;) Smutna akcja z nia byla…

60. Jiobel napisał(a):
05 kwietnia 2008, 22:10:06

Susek, ten wpis nie ma nic wspólnego z techblogiem. Zupełnie. Więc – byłbym wdzięczny…

61. Susek napisał(a):
05 kwietnia 2008, 22:11:20

@ Jiobel – ktoś mnie wyprzedził.

62. sparrow napisał(a):
05 kwietnia 2008, 22:12:19

wpis z techbloga USUNIETY

robots.txt dziala od prawie 2 lat

reszta wystarczy zrobic blokade na ip

63. hk napisał(a):
06 kwietnia 2008, 09:57:18

Rozumiem, że wy chcecie się pozbyć czytelników z waszych blogów? Ech, tylko w Polsce takie pomysły…

Oczywiście rozumiem także, że splogi to plaga. Ale nie rozumiem jak można porównywać działanie agregatora takiego jak blognews, którego jedynym zadaniem jest skierowanie czytelników do właściwego bloga.

64. btm napisał(a):
06 kwietnia 2008, 09:59:47

@hk: no nie do końca. Pomijając fakt, że nikt nie pytał o zgodę / nie respektuje licencji na jakiej rozpowszechniane są informacje na blogach, to kopiowanie notek może tylko zaszkodzić – duplicate content w google i nie raz jest w indeksie wyszukiwarki wyżej niż strona źródłowa. Dodatkowo, skąd mam mieć pewność, że na stronie nagle nie pojawią się reklamy googla i autor nie zacznie zarabiać na adSense generowanym dla mojego contentu?

Na typowych agregatorach, takich jak blogfrog czy coś mam wpływ na to czy i co jest publikowane.

65. hk napisał(a):
06 kwietnia 2008, 10:35:16

@btm: Czy Google pyta cię o zgodę indeksując (kopiując) całą stronę:

http://64.233.183.104/search?q=cache:HHbZGBBNuXcJ:btm.anfo.pl/+%22http://btm.anfo.pl%22&hl=pl&ct=clnk&cd=1&gl=pl

A filtr DC jest tak skonstruowany, że prawdopodobnie złapie go strona która powstała później. Widziałem kiedyś wywiad z miłą panią z Googla i prosiła abyśmy nie demonizowali. Inaczej bardzo łatwo było by szkodzić innym.

Fakt, blognews nie jest typowym agregatorem, jest automatem, nie faworyzuje nikogo i działa wg. algorytmu. Tworzą go ludzie zainteresowani rozwojem blogosfery w Polsce. Na GrillIT jakiś czas temu była jego prezentacja.
http://www.grillit.pl/?p=65
Byłem, widziałem – zapowiada się bardzo ciekawie.

Dodaj komentarz:

Textile Lite włączony ( szczegółowy opis znaczników ):
*strong* | # lista numerowana | * lista wypunktowana | _em_ | __italic__ | "link":http:// | bq. cytat.

MyBlogLog

Archiwum

LastFM