Strona 1 z 1

Ftp i polskie znaki w plikach xml

: 19 października 2008, 16:14
autor: dsue
Temat okołodebianowy...

Na stronach Urzędu Zamówień Publicznych (ftp://ftp.uzp.gov.pl/bzp/xml) można pobrać ogłoszenia o zamówieniach w postaci plików xml. Niestety są one z polskimi krzakami.

Jak się do nich dobrać?

Pozdrawiam

: 19 października 2008, 20:22
autor: fnmirk
Musisz mieć dostęp do systemu/programu pracującego z kodowaniem utf8. Dokumenty te korzystają z kodowania utf8.

: 19 października 2008, 21:24
autor: dsue
fnmirk pisze:Musisz mieć dostęp do systemu/programu pracującego z kodowaniem utf8. Dokumenty te korzystają z kodowania utf8.
¬le się wyraziłem. Do samego xmla się dobiorę, tu nie ma problemu. Gorzej że nazwy tych plików zawierają polskie znaki i nie mogę ich pobrać (np. w nazwie pliku jest łódzkie)

Pozdrawiam

: 19 października 2008, 21:29
autor: genobis

Kod: Zaznacz cały

wget -c -r -P [KATALOG POBIERANIA] [url]ftp://ftp.uzp.gov.pl/bzp/xml/2008-01-01/[/url]
...i niech moc będzie z Tobą!

: 19 października 2008, 21:38
autor: dsue
genobis pisze:

Kod: Zaznacz cały

wget -c -r -P [KATALOG POBIERANIA] [url]ftp://ftp.uzp.gov.pl/bzp/xml/2008-01-01/[/url]
Dzięki serdeczne za pomoc.

Pozdrawiam

: 19 października 2008, 21:39
autor: fnmirk
dsue, pliki na serwerze mają nazwy kodowane w iso8859-2. Mam w systemie domyślne kodowanie utf8 i bez żadnych problemów pobieram te pliki z poziomu przeglądarki. Spróbuj sposobu, który podał genobis.

edit:
Przy pobieraniu pliku możesz przy zapisywaniu pojedynczego pliku zmienić jego nazwę.

: 19 października 2008, 22:37
autor: dsue
Sposób pobierania genobisa działa i o to mi właśnie chodziło (pliki będzie pobierał skrypt). Jak mogę zmienić nazwę pobieranego pliku (te nazwy xmli się nie zmieniają, tylko katalog w którym leżą).

Pozdrawiam

: 20 października 2008, 01:13
autor: fnmirk
Po pobraniu tych plików możesz zmieniać nazwy pojedynczego pliku np. w programie mc (midnight commander). Przynajmniej pozwala na to Linux nie wiem jak Twój system.

Zajrzyj jeszcze do dokumentacji programu wget. Może coś znajdziesz:
http://ptm.linux.pl/man_HTML/info_pl_HT ... t_toc.html