地味で地道なはてなブログ

ダイアリー「地味で地道な」から引っ越しました。

某アパレル系サイトのデータ入力

売上からいって、果てしなく無職に近い個人事業主としては、やっぱちょっと小金を貯めなくてはならんわけで。
データ入力は以前バイトでやったことがあるので、ま、なんとかいけるかな、と。

しかし件数の桁が違った。
さすがに500件強はなかなか堪えた。
終わってから一日寝込んだ。

作業内容は、基本的にコピペ。
あるサイトの商品データをちまちまと抜き出してリストを作り
リストに従ってちまちまとコピー先のサイトにアップする。
しかも商品データなので、リストを作った時点であった商品がなくなったり、なかった商品がわいて出てきたりと、なかなかやってくれる。

技術者としてはとても理不尽な作業ではある。
web上のデータを手で抜き出して手で打ちこむなんて、あまりにも前時代的。
そう、まだ20世紀だったころにやっていたような作業だ。
csvデータ提供してくれたらいくらでもできるんだけどな。

そんでも私はまだ恵まれている方で、こういうデータをどう管理すると楽かは知っている。
データは、サイト上の商品名他のテキストデータと、商品の写真から成り立っている。
テキストデータを全部律義に落としても、あまりいいことがない。
せいぜい商品名位。
でも商品には色違いとかサイズ違いとかいろいろあるため、抜き出したあとでアップするときにもうそこでデータが変わってたりとか、探し出すのがたいへんだったりする。
写真データもひとつの商品について複数存在するので、何かで紐付けしないとどれがどれやら。

ここで商品コードが登場する。彼は狂っていた。

どうやらそのブランドの商品コードは種別ごととかいうことはなしで、登録した順に番号が振られるため、一意ではあるけれど、全然整合性のない商品コードをもとにしてまとめるのは難しい。

しかして商品ごとに一意であるのは変わらないので、分類コードを作って、画像データを保管するときにSEQ−枝番−商品コードという番号を振ってカテゴリ毎にフォルダを作ってしまっておいて、
コピペ先ではSEQと商品コードを頼りに各商品データを抜き出してがつがつ作業した。

抜き出す作業もたいへんだけど、登録作業が思っていた以上に時間を食うため、結構苦しんだ。

しかし終わってみて振りかえると、登録作業よりも、データ抜き出しの方がまったり作業していたので、とにかくとっととデータ作ってしまうことを最優先した方があとあと楽だと気付いた。

データの付番は今回作ったやりかたでよいし、画像データに商品番号が振ってあれば、dirでファイル名を抜き出して、Excelでさくっと区切って枝番=1のものを抜き出せば、一意な商品コードの一覧ができるわけで。
商品データは、元と先のそれぞれのサイト開きっぱにしてせっせとコピペ。

やっぱりもっと楽できる方法があるような気がするのだけど、まだ思いつかない。
ファイルに分類コード持たせると、手のつけられない有様になるので、これはこのままでいいと思うけど、どっかもっと楽できそう。
画像を落としてくるとき、irvineは使えないし(画像だらけなので)
連番は人間がみて振らなくてはならない。
でもまだどっか楽にできる方法があるとゴーストがささやいているのだが、よく聴こえない。

また同様の作業をする予定があるのだけども、それまでに何らかの時間短縮方法を思いつかないとなー。