不揃いのデータたち

職場では、最近ひたすらパソコン上の作業をしている。生徒の選択科目登録をしているのだ。こいつをやらないと、中間考査後に行われる、全校的なパソコンでの得点入力作業に臨めない。

近年、私の職場もパソコンの使用が浸透してきている。そのため、何らかの集計を行う場合、紙に書いた情報を人様に提出するのではなく、予め書式を設定しておいた Excel・Access・桐 などのファイルにデータを入力する場面がある。私が依頼することもあるし、依頼されることもある。こういった場合、パソコンに慣れているヒトと、慣れていないヒトでは、入力するデータの質に、劇的に差が付いている気がする。しかし、画面上では分からなかったりする。
私が他人のパソコン習熟判定に用いる「リトマス試験紙」、それは「スペース」という文字の扱いである。

私が誰か(例えばクラス担任)にデータの入力を依頼する場合、基本的には「コード化したデータの入力」をお願いする。そして、間違ったコードを入力すると、画面には文字などが出ないようにしておくのだ。そうすると、入力されたデータが不揃いになることが基本的に回避される。

しかし、人様が作成された入力フォームなどでは、勝手な文字列を入力できる状態になっていることが多い。その結果、生徒の氏名などの後ろに「無意味なスペース群」が続いたり、何も入力されていないと思っている「セル」に「スペース」が入り込んでいたりする現象が起こる。

職場では「情報処理部」ってヤツに所属しているので、最初に書いた「選択科目登録」を行っているのだ。いろんなヒトが関わって作成されたデータを照合したり、並び替えを行ったりしていく。その途中、「スペース入りのセル」に結構出くわすワケです。
本当はムダな文字列を排除するように、関数等を用いてそいつらを除去してしまえば良いのかも知れない。でも結局、ひたすら検索&置換を行ったりするのですね。

結局、人力での「検索&置換」のほうが安全で早いような気がするのです。私が扱っている「データの量」と「不揃い加減」を勘案するに。

ここにあるのは2006年5月16日 21:40の日記です。

ひとつ前の日記は「検索エンジンと「てくのら亭」」です。

次の日記は「二酸化炭素売ります」です。

最近の日記はこちらで見られます。過去に書かれたものはアーカイブで見られます。