2009 年 7 月 25 日 by 村山 俊之
otoco に限らず、 PC 上で動作するプログラムの多くは、テキストを処理することを目的の一部またはすべてとしています。 otoco の場合は特に、どこの誰とも分からない人が MML を書き、それを読み込んで XML やら SMF やらオーディオやら楽譜やらに変換することを目的としているので、どこの誰が MML を (あるいは XML を直接) 書いても問題なく処理できるよう、文字セットの扱いには丁重でなければなりません。
当初の方針として、 otoco では内部コードに Unicode を使用し、その物理型は wchar_t で扱うつもりでいました。この辺、C/C++ でのクロスプラットフォーム開発に慣れていないと陥りやすい罠であるように思うのですが… 現状の wchar_t ははっきり言ってクロスプラットフォーム開発には向いていないものといわざるを得ないようです。
とりあえず確認しているのは Windows の VC++ 2008 と Linux の gcc だけなのですが、それだけでも調べた限りで以下のような相違点がありました。
この投稿の続きを読む »
タグ: C++, iconv, otoco, Unicode, wchar_t, 文字セット, 文字列処理
カテゴリー: 技術メモ, 活動記録 | 3 件のコメント »
2009 年 7 月 23 日 by 村山 俊之
Boost ライブラリの Ubuntu へのインストールは容易でした。単に libboost-dev パッケージを aptitude install
してあげるだけです。
問題は、前回も書いた通り、 apt からインストールできる Boost のバージョンは通常で 1.34.1、最新のものを選んでも 1.37.0 になってしまう、ということです。
そこで、 otoco の開発に影響する範囲で、バージョン間にどの程度の差異があるのか、調べておくことにしました。
とりあえず今思いつくのは正規表現まわりだけだったのでまだそこしか調べていないのですが (空文字列マッチは何気に影響範囲大きそうですが…古いバージョンで統一しておけばとりあえず問題にはならないかな…)、実際に開発が進めば利用範囲が広がり、都度気づく部分も増えていくかもしれません。上記ページはその都度更新して行く予定です。
タグ: Boost, C++, otoco, Ubuntu
カテゴリー: 技術メモ, 活動記録 | コメントはまだありません »
2009 年 7 月 16 日 by 村山 俊之
昨日、一昨日はメインの仕事の都合で朝が早かったので、こっちの作業はちょっと pending してました。
cl.exe
コマンドを直接呼んでビルドする方法については調査完了しました。必須オプションが何気に多いですね…。実際にはあれに最適化オプションなりデバッグオプションなりがくっつくことになります。
で、今度は Ubuntu でのセットアップを調べているのですが、ここで問題発覚。どうやら Ubuntu での boost ライブラリのメインバージョンはまだ 1.34.1 で止まっているようです…。もしかしたら Debian を始め、多くの Linux ディストリビューションにおいても同様の状況なのかもしれません。当初は最新の 1.39.0 を利用する予定でしたが、事実上の汎用性が損なわれる可能性もあるので (さすがにライブラリを手動でインストールしてくれ、とやる訳にもいかないですからね…)、互換性を確認しつつ、バージョンについては考慮しなければならないかもしれません。
インストールして動かして、というあたりはまだこれから調査するところです…。
タグ: Boost, C++, otoco
カテゴリー: 技術メモ, 活動記録 | 1 件のコメント »
2009 年 7 月 13 日 by 村山 俊之
Windows 環境で Boost ライブラリをセットアップしてみました。明日は Linux 環境でもセットアップを行い、技術メモとしてまとめる予定です。
で、せっかくなので、試しに簡単なサンプルを作って動作確認をしてみました。
#include <iostream>
#include <fstream>
#include <string>
#include <boost/regex.hpp>
using namespace std;
using namespace boost;
void escapeHtml(const string &src, string &modified);
int main(int argc, char* argv[])
{
for (int i = 1; i < argc; i++)
{
ifstream fin(argv[i]);
if (fin.bad() || fin.fail())
{
cerr << argv[0] << ": Can't open " << argv[i] << "." << endl;
continue;
}
while (!fin.eof())
{
string line;
getline(fin, line);
string modified;
escapeHtml(line, modified);
cout << modified << endl;
}
}
return 0;
}
void escapeHtml(const string &src, string &modified)
{
modified.clear();
sregex_iterator last_it;
for (sregex_iterator it(src.begin(), src.end(), regex("[<>&\"]")); it != sregex_iterator(); it++)
{
modified += it->prefix().str();
string sub = (*it)[0].str();
switch (sub[0])
{
case '<': modified += "<"; break;
case '>': modified += ">"; break;
case '&': modified += "&"; break;
case '"': modified += """; break;
default: assert(0); break;
}
last_it = it;
}
modified += last_it == sregex_iterator() ? src : last_it->suffix().str();
}
Boost.Regex の regex_iterator を用いたテストです。よーするに、コマンドに指定したファイルの HTML エスケープ処理を施してコンソールに書き出すプログラムです。
上記のプログラムを test.cpp などのファイル名で保存し、そのまま Visual Studio 2008 コマンドプロンプト上で
cl test.cpp
とやってみましたが、これだけではコンパイルできませんでした。どうやら、 Visual Studio のオプションダイアログでヘッダーファイルやライブラリの参照先ディレクトリを設定しても、その設定が参照されるのは Visual Studio の IDE からビルドを実行した場合のみのようです。あるいは、環境変数 INCLUDE や LIB を設定してあげればこれでコンパイルできるのかも知れません。その辺はまた追々調べてみますが、最終的には .configure
に --boost-prefix
といったようなオプションを設ける、といった形の対応になるのではないかとも思います。
ちなみに、これと同等の (しかもより確実に動作する) プログラムを Perl で記述すると、以下の通りになります (この書き方はしかし Unix 風環境限定ですが)。
#!/usr/bin/perl -p
s/[<>&"]/'&'.{qw(< lt > gt & amp " quot)}->{$&}.';'/eg;
うあー、やっぱりスクリプト言語は便利だなー (汗。
2009年 7月 28日 火曜日 16:56:07 JST – 追記
egtra 様、ご指摘感謝です。仰る通り、 string::getline()
を使った方がスマートなので、その通りに修正させて頂きました。
タグ: Boost, C++, otoco, Perl, 正規表現
カテゴリー: 技術メモ, 活動記録 | 1 件のコメント »
2009 年 7 月 7 日 by 村山 俊之
こんなんできました~。
…なんか、UI と I/O の関係図にデータの流れも含まれてるなぁ。これだったらデータの流れ図要らなかったかも…。ていうか、基本的にはここでやりたかったのは必要な UI の可視化なので、実行時オプション、設定ファイル、警告出力、そして各種操作が、各処理とどう関係するか、という部分だけ書いて、データの流れは含めるべきではなかったかも…。あと端子で書いた 3つの出力もデータの流れ図で示すべきだったかも…。データの流れ図ではファイルと見分けが付かないしなぁ…。
タグ: otoco, 設計
カテゴリー: 技術メモ, 活動記録 | コメントはまだありません »
2009 年 7 月 6 日 by 村山 俊之
なんだけど、いまいちしっくりこないので、まだ未公開です…。ちょっと時間をかけすぎてしまった (1時間以上オーバー^_^;)。
…操作と入出力がごっちゃになっちゃってるなぁ。入力はファイルを規定しているのに出力はそれを規定しないからアンバランスになってるんだろうな。操作が処理を呼び出す関係と処理による入出力の関係は切り離さないとな。出力はどうやって示そう? コネクタが良いのかなぁ… (以上独り言)
タグ: otoco, 設計
カテゴリー: 技術メモ, 活動記録 | コメントはまだありません »
2009 年 7 月 5 日 by 村山 俊之
otoco の処理におけるデータの流れを書いてみました。この奇っ怪な図の作図には OpenOffice.org の Draw を利用しています。
この手のツールの場合、データの流れはそのまま必要な処理を浮き彫りにするので、システムの構成を表現する情報の一つとして重要な資料になります。そして、実際のモジュール構成をもろに規定する仕様とはならないので、あくまで外部仕様として扱うことができるのも大きな利点です。
明日以降はこれに加えて、UI と処理との関係を設計します。
タグ: otoco, 設計
カテゴリー: 活動記録 | コメントはまだありません »
2009 年 7 月 3 日 by 村山 俊之
コマンド仕様、用語集の転載が完了。これで、既存の仕様の転載は完了しました。
用語集の中で脚注 (フットノート) を使っていたので、急遽FootNoteMacro プラグインをインストールしました。 wget ではうまくダウンロードできなかったので、手元でダウンロードしたものを rsync で転送した後、
% unzip footnotemacro-r6151.zip
% cd footnotemacro/0.11
% sudo setup.py install
とし、Trac の管理メニューでプラグインを有効に。メインの仕事で使っているプロジェクトの Trac からも使えるようになっているはずなので、ちょくちょく使っていこうかな? …あっちはおいら一人で使ってるから脚注なんて使う機会無いか。(^_^;
この投稿の続きを読む »
タグ: otoco, Trac
カテゴリー: 技術メモ, 活動記録 | コメントはまだありません »
2009 年 7 月 3 日 by 村山 俊之
メインの仕事の方が押していたので、朝からそっちの作業を進めていました。
で、本当なら今頃リリース作業の予定だったのですが、諸事情合って急遽中止。開発案件もまだ残ってるし作業を進められなくもないのですが、疲労もたまっているのでとりあえず一休みして、野球の中継が始まったら観戦しつつ otoco の方をちょこちょこ進めようかなと思っております…。
タグ: otoco
カテゴリー: 活動記録 | コメントはまだありません »
2009 年 7 月 2 日 by 村山 俊之
制御命令一覧の転載が完了しました。
otoco の制御命令は Perl 版でも実装実績がまだ無く、仕様に関しても、構想はあるんだけれども内容は埋まらないまま穴だらけ、という状態です。メタイベントの類とか、むしろ実装が容易な上にプライオリティも高そうなものが未定義のままほったらかしですね…。早いとこどうにかしないと。
すでに仕様が埋まっている制御命令にもいくつか問題があります。まず #charset 。これ、Encode.pm の仕様を前提にして書かれているので、指定できる文字セット名がちょっと豊富すぎますw。そもそもの問題として、文字セットを扱うライブラリに何を利用するのか決めないといけません (iconv にするか、nkf にするか、他のを探すか… boost にその辺やってくれるクラスがあればいいんだけどなぁ…)。
それともう一つ、#function で関数を定義するときに用いるスクリプト。 Perl 版では eval を用いる気満々で、まんま Perl で書かせるつもりでいたのですが (ファイルとかを扱えてしまえるのは問題なので、その辺の安全性をどうやって確保するかで頭を悩ませてはいましたが)、C++ から Perl パーサを呼び出す気にはなれないし (あんまり動作安定してないですからね、あれ)、自前で Perl パーサを作るなんて以ての外。という訳で、自前でスクリプト言語の仕様を考えなければなりません。まぁ、Lua かなぁ…。
タグ: otoco, 文字セット
カテゴリー: 技術メモ, 活動記録 | コメントはまだありません »