Strona 1 z 1
Ftp i polskie znaki w plikach xml
: 19 października 2008, 16:14
autor: dsue
Temat okołodebianowy...
Na stronach Urzędu Zamówień Publicznych (
ftp://ftp.uzp.gov.pl/bzp/xml) można pobrać ogłoszenia o zamówieniach w postaci plików xml. Niestety są one z polskimi krzakami.
Jak się do nich dobrać?
Pozdrawiam
: 19 października 2008, 20:22
autor: fnmirk
Musisz mieć dostęp do systemu/programu pracującego z kodowaniem utf8. Dokumenty te korzystają z kodowania utf8.
: 19 października 2008, 21:24
autor: dsue
fnmirk pisze:Musisz mieć dostęp do systemu/programu pracującego z kodowaniem utf8. Dokumenty te korzystają z kodowania utf8.
¬le się wyraziłem. Do samego xmla się dobiorę, tu nie ma problemu. Gorzej że nazwy tych plików zawierają polskie znaki i nie mogę ich pobrać (np. w nazwie pliku jest łódzkie)
Pozdrawiam
: 19 października 2008, 21:29
autor: genobis
Kod: Zaznacz cały
wget -c -r -P [KATALOG POBIERANIA] [url]ftp://ftp.uzp.gov.pl/bzp/xml/2008-01-01/[/url]
...i niech moc będzie z Tobą!
: 19 października 2008, 21:38
autor: dsue
genobis pisze:Kod: Zaznacz cały
wget -c -r -P [KATALOG POBIERANIA] [url]ftp://ftp.uzp.gov.pl/bzp/xml/2008-01-01/[/url]
Dzięki serdeczne za pomoc.
Pozdrawiam
: 19 października 2008, 21:39
autor: fnmirk
dsue, pliki na serwerze mają nazwy kodowane w iso8859-2. Mam w systemie domyślne kodowanie utf8 i bez żadnych problemów pobieram te pliki z poziomu przeglądarki. Spróbuj sposobu, który podał genobis.
edit:
Przy pobieraniu pliku możesz przy zapisywaniu pojedynczego pliku zmienić jego nazwę.
: 19 października 2008, 22:37
autor: dsue
Sposób pobierania genobisa działa i o to mi właśnie chodziło (pliki będzie pobierał skrypt). Jak mogę zmienić nazwę pobieranego pliku (te nazwy xmli się nie zmieniają, tylko katalog w którym leżą).
Pozdrawiam
: 20 października 2008, 01:13
autor: fnmirk
Po pobraniu tych plików możesz zmieniać nazwy pojedynczego pliku np. w programie mc (midnight commander). Przynajmniej pozwala na to Linux nie wiem jak Twój system.
Zajrzyj jeszcze do dokumentacji programu wget. Może coś znajdziesz:
http://ptm.linux.pl/man_HTML/info_pl_HT ... t_toc.html