Правильные словари для ZBedic

КПК с Linux, установка Linux на iPaq и другие модели, программы
Закрыто
kfetisov
Кандидат (3 lvl)
Сообщения: 193
Зарегистрирован: Ср июн 04, 2003 15:03

Re: "Кушать подано! Идите жрать, пожалуйста!" ;)

Сообщение kfetisov » Пт сен 10, 2004 08:30

relb писал(а):Как и обещал, вот:
Русско-Английский Королева 1.7M (md5)
Англо-Русский Королева 1.6M (md5)
Русско-Английский Сократ 564k (md5)
Англо-Русский Сократ 676k (md5)

Замечание по поводу Сократа.
На сколько я понял - это не полноценный словарь, а словарная база от одноименного переводчика. Словарных статей конечно много, но они очень маленькие (одно-два слова). Правда много словосочетаний. Но их и в Мюллере достаточно.
Это все мое IMHO. Так что если понравится - пользуйтесь.
А вот вопросик возник - а нельзя ли какие-нибудь русско-немецкие и наоборот словарики переконвертить?

С сибирским приветом,

Константин.
С сибирским приветом,

Константин
--
Nokia 9300 6.27/ Iphone 8Gb 1.1.2 / GP2X MKII

maravan
Новенький (0 lvl)
Сообщения: 14
Зарегистрирован: Вс янв 16, 2005 13:10

Сообщение maravan » Чт фев 17, 2005 01:53

Ни один линк на словари не работает!!!
Выложите/пришлите пожалуйста .
Zaurus SL-C700

maslovsky
Нобелевский лауреат (7 lvl)
Сообщения: 2781
Зарегистрирован: Пн окт 20, 2003 20:14

Сообщение maslovsky » Чт фев 17, 2005 08:28

maravan писал(а):Ни один линк на словари не работает!!!
Выложите/пришлите пожалуйста .
Словари есть в Cacko feed: http://cacko.biz/cacko/feed/

maravan
Новенький (0 lvl)
Сообщения: 14
Зарегистрирован: Вс янв 16, 2005 13:10

Сообщение maravan » Чт фев 17, 2005 17:58

Спасибо!
Zaurus SL-C700

fAX
Аспирант (2 lvl)
Сообщения: 60
Зарегистрирован: Ср июн 04, 2003 15:03

Сообщение fAX » Пн май 09, 2005 05:32

Ожегов и БЭС кому-нибудь нужен? Правда, в последнем очень много статей пришлось на части порезать из-за ограничения в 16Кб/entry в xerox (индексатор словарей).
Sharp Zaurus SL-C750.

geometer
Доктор (4 lvl)
Сообщения: 340
Зарегистрирован: Вс июн 27, 2004 09:55

Сообщение geometer » Ср май 11, 2005 03:38

Нужны!! ;)
-- geometer

fAX
Аспирант (2 lvl)
Сообщения: 60
Зарегистрирован: Ср июн 04, 2003 15:03

Куда положить?

Сообщение fAX » Ср май 11, 2005 04:08

Куда можно выложить?

Ожегов занимает 2537912 bytes.
БЭС занимает 13642495 bytes.

ВНИМАНИЕ! оба словаря работают только с ZBedic >= 0.95!!! (брать с http://sourceforge.net/project/showfile ... _id=321224 )

Могу выложить и "перловую" кашу, которую я набросал для этой цели. Делает почти всё, только нужно начало и конец подправить в текстовом редакторе, удалить мусор и комментарии.
Sharp Zaurus SL-C750.

svsleaves
Доктор (4 lvl)
Сообщения: 312
Зарегистрирован: Ср июн 04, 2003 15:03

Re: Куда положить?

Сообщение svsleaves » Ср май 11, 2005 12:31

fAX писал(а):Куда можно выложить?

Ожегов занимает 2537912 bytes.
БЭС занимает 13642495 bytes.

ВНИМАНИЕ! оба словаря работают только с ZBedic >= 0.95!!! (брать с http://sourceforge.net/project/showfile ... _id=321224 )

Могу выложить и "перловую" кашу, которую я набросал для этой цели. Делает почти всё, только нужно начало и конец подправить в текстовом редакторе, удалить мусор и комментарии.
Очень хочется.
Может в cacko feed найется место?

fAX
Аспирант (2 lvl)
Сообщения: 60
Зарегистрирован: Ср июн 04, 2003 15:03

ссылки

Сообщение fAX » Чт май 12, 2005 12:53

словарь Ожегова (2479 кб)
Большой энциклопедический словарь (13321 кб)

У меня нет постоянного хостинга, поэтому выкладываю на webfile. Поэтому все, кому нужны эти словари, пожалуйста, заберите их поскорее.

В выходные почитаю, как делать .ipk и постараюсь выложить также и в этом формате, чтобы можно было в feed его положить.

На всякий случай, выкладываю и скрипт для трансформации из stardict'овских словарей.

dict2zbedic.pl
Usage:

Код: Выделить всё

./dict2zbedic.pl <unzipped input dictionary> <unzipped output dictionary> -x <full path to xerox executable> [-s <split size>] [-n <name>]
Example:

Код: Выделить всё

./dict2zbedic.pl ozhegov myozh.dic -x '../zbedic/libbedic/objs.x86/xerox' -s 7000 -n Ozhegov 
  • split size не должен превышать 16000
  • name лучше присвоить английское, по крайней мере, utf-8 zbedic в списке не отображает.
  • Полученный .dic файл лучше ужать dictzip'ом (dictzip myozh.dic)
  • И это... код писан на коленке, не судите строго ;)

Код: Выделить всё

#!/usr/bin/perl -w

# author: Pavel Gurevich aka fAX
# license: GPL v2.

use strict;
use Getopt::Long;

use vars qw ( $opt_xerox
              $opt_name
              $opt_counter
              $opt_split
              $opt_cut
            );

&GetOptions ("-xerox|x=s",
             "-name|n=s",
             "-split|s=i",
             "-counter|c=i",
             "-cut"
            );

my $begin = 0;
my $input = shift @ARGV;
my $output = shift @ARGV || 'output.dict.dz';
my $lfcounter = 0;

my $tmp = "/tmp/dic2zbedic";
my $name = $opt_name || "generated dictionary";
my $prev_word = '';
my $desclen = 0;
my $counter = 0;
my $word_cnt = 1;
$opt_counter ||= 5000000;
my $split = $opt_split || 15000;


my ($word, $description);

open ( INPUT, $input ) || die "Cannot open input file '$input': $!\n";
open ( TMP, ">$tmp" );

input: while ( <INPUT> ) {
  chop;
  m/^$/ && do {
    ++ $lfcounter;
    if ( $word && $description ) {

#      $word =~ m/^#/ && do { last; };
      if ( $word ne $prev_word ) {
#        print TMP "{/s}\000" if ( $prev_word );
        print TMP "\000$word\012";
        $desclen = 0;
        $word_cnt = 1;
      } elsif ( $opt_cut ) {
        next;
      }

      $desclen += length $description;
      if ( $desclen > $split ) {
        if ( $opt_cut ) {
          print TMP "{s}{ss}" . substr ( $description, 0, $split ) . "...{/ss}{/s}";
          $description = '';
          $desclen = 0;
          next input;
        } else {
          print TMP "\000$word  ($word_cnt )\012";
          ++ $word_cnt;
        }
        $desclen = 0;
      }

      while ( length $description > $split ) {
        my ( $desc ) = substr ($description,0,$split,'') . "...";
        print "Splitted $word\n";
        $description = "..." . $description;
        print TMP "\000$word ($word_cnt )\012";
        print TMP "{s}{ss}$desc\{/ss}{/s}";
        ++ $word_cnt;
        if ( $opt_cut ) {
          $description = '';
          $desclen = 0;
        }
      }
      print TMP "{s}{ss}$description\{/ss}{/s}";
      $prev_word = $word;
      $word = '';
      $description = '';
      ++$ counter;
      last if ( $counter > $opt_counter );
    }
    next;
  };

  if ( $lfcounter >= 4 ) {
    $begin = 1;
    print TMP "id=$name\012";
    print TMP "description=This dictionary was created using dict2zbedic.pl from file '$input'\012";
  }

  if ( !$begin ) {
    $lfcounter = 0;
    next;
  }

  if ( $lfcounter > 0 ) {  # Word
    $lfcounter = 0;
    s/^\s*//;
    $word = $_;
    next;
  } else {
    $description .= $_;
    next;
  }
}
print  TMP "\000";
close ( TMP );
my $command = "$opt_xerox  $tmp $output";
( system( $command ) >> 8 ) && die "Error running '$command': $!\n";
unlink $tmp;

[/list][/url]
Sharp Zaurus SL-C750.

maslovsky
Нобелевский лауреат (7 lvl)
Сообщения: 2781
Зарегистрирован: Пн окт 20, 2003 20:14

Re: ссылки

Сообщение maslovsky » Чт май 12, 2005 15:20

fAX писал(а):словарь Ожегова (2479 кб)
Большой энциклопедический словарь (13321 кб)

У меня нет постоянного хостинга, поэтому выкладываю на webfile. Поэтому все, кому нужны эти словари, пожалуйста, заберите их поскорее.

В выходные почитаю, как делать .ipk и постараюсь выложить также и в этом формате, чтобы можно было в feed его положить.
Отлично! Обязательно добавлю словари в feed.

Аватара пользователя
DMych
Доктор (4 lvl)
Сообщения: 435
Зарегистрирован: Пн июл 28, 2003 10:20

Словари языка Эсперанто

Сообщение DMych » Чт май 12, 2005 15:47

Если есть среди завроводов эсперантисты, на http://bedic.sourceforge.net/ выложен Universala Vortaro.
В скором времени сделаю еще пару словарей (Эсперанто-русский Бокарева и Komputada Leksikono Покровского).
Zaurus SL-C860 + SD 1G + CF 512M + Bluetooth-GPRS
Cacko 1.22a

fAX
Аспирант (2 lvl)
Сообщения: 60
Зарегистрирован: Ср июн 04, 2003 15:03

Re: ссылки

Сообщение fAX » Чт май 12, 2005 18:17

maslovsky писал(а): Отлично! Обязательно добавлю словари в feed.
Если бы кто дал ftp, куда закачать, я бы все словари с mova.org поконвертил со временем. Я ещё чуть поправлю скрипт, чтоб комменты оригинальные оставлял, а то некрасиво получается.

Да! Я опечатался, скрипт конвертит словари формата DICT, не StarDict!
Sharp Zaurus SL-C750.

Vladimir_P
Кандидат (3 lvl)
Сообщения: 194
Зарегистрирован: Пт авг 13, 2004 13:51

Re: Словари языка Эсперанто

Сообщение Vladimir_P » Пт май 13, 2005 08:34

DMych писал(а):Если есть среди завроводов эсперантисты
Логланщики есть. Логлано-английский и англо-логланский словарь можно сделать?
(Информацию и софт см. по адресу www.loglan.org.
Sharp Zaurus SL-C860, D-Link DCF-650BT, CACkO Qtopia ROM 1.22a
Desktop: Kubuntu Linux, KDE, Beryl

fAX
Аспирант (2 lvl)
Сообщения: 60
Зарегистрирован: Ср июн 04, 2003 15:03

Выложил словари

Сообщение fAX » Пн май 16, 2005 03:51

maslovsky писал(а):
fAX писал(а):словарь Ожегова (2479 кб)
Большой энциклопедический словарь (13321 кб)

У меня нет постоянного хостинга, поэтому выкладываю на webfile. Поэтому все, кому нужны эти словари, пожалуйста, заберите их поскорее.

В выходные почитаю, как делать .ipk и постараюсь выложить также и в этом формате, чтобы можно было в feed его положить.
Отлично! Обязательно добавлю словари в feed.
Скачать словари в течение около 2-х недель можно с http://physics-regelman.com/fax/

Я положил там словарь Ожегова, Ожегова-Шведовой и Большой энциклопедический (исправленный). Все словари доступны как сами по себе, так и в виде .ipk (сколько я возился с последним форматом! мамочки! ну кто же знал, что он хочет ./control.tar.gz в архиве, а просто control.tar.gz - "не катит"... Ну да ладно...).
Sharp Zaurus SL-C750.

Аватара пользователя
DMych
Доктор (4 lvl)
Сообщения: 435
Зарегистрирован: Пн июл 28, 2003 10:20

Re: Словари языка Эсперанто

Сообщение DMych » Пн май 16, 2005 13:52

Владимир П. писал(а): Логланщики есть. Логлано-английский и англо-логланский словарь можно сделать?
(Информацию и софт см. по адресу www.loglan.org.
Пока не разберусь с остальными словарями, ничего другого делать не буду. Сорри.

Кстати, если кто знает: ограничение в 16К на статью - на что оно влияет? Я тут изменил в исходниках xerox это значение (добавил нолик справа) и пока ни на десктопе (qbedic), ни на завре (0.9.5) ничего подозрительного не заметил. В словаре Даля, который я сейчас колупаю, есть статейки поболее 16К объемом - все чудненько открывается и читается.
Zaurus SL-C860 + SD 1G + CF 512M + Bluetooth-GPRS
Cacko 1.22a

Закрыто

Вернуться в «КПК и смартфоны на Linux: Zaurus, планшеты Nokia, прочее»