< | >

複数行あるテキストをブロックごとにExcelの1セルに入れる方法
  • (2015-02-01 07:23:20)

リストのバリエーションを作るにはExcelが有利


商品リストをhtmlに変換する際、テキストで編集するが、商品番号順やフラグなどでソートしたバリエーションのリストを作成するにはExcelで編集した方が圧倒的に有利。

たとえば、一つの商品の記述がこんな感じ。

<tr>
<td id="col01"><input type="hidden" name="good" value=0><select name="good"><option>0</option><option>1</option></select></td>
<td id="col02">よいお品</td>
<td id="col03">Very Good Goods</span></td>
<td id="col04">
Very Good Goods, Buy Now!
</tr>

テキストをExcelに取り込む


単行の商品リストならテキストからExcelに取り込むことはそのままコピペだが、改行コードを含むブロックをそのままExcelに取り込むとしたら、はて、どうやるんだろうと、一瞬わからなかった。

「改行コード」が入っていれば、通常csvでは下のセルに移る。「カンマ(,)」が入っていれば、右のセルに移動する。

ブロックを「"」で囲んだら?


csvでは改行コードを含むテキストは「"」で囲まれていることを思い出した。基本これで行けそうだが、やろうとしたら、テキスト内にも「"」がある。「\"」とか使えるのかな?と思ったが知らない。

実際にExcelに入れてみたら「"」が「""」に


わからないので、実際にExcelにこういったテキストを入れて、csvに吐き出させることにした。それが早い。

「"」は「""」に置換されていた。なるほど・・・

UTF-8のhtmlをExcel2003に入れると文字化け


もう一点の注意点はExcel2003の文字コードはShift_JISである点。UTF-8のhtmlを入れるとの間で文字化けを起こす。

操作中はすべてShift_JISで扱い、最後にUTF-8ベースのhtmlにテキストだけコピーすればよいかもしれない。






< | >

公開したくない情報はそもそもネットに上げない
  • (2015-01-03 07:26:13)
非公開にしたい情報なら、そもそもネットに上げないこと。クラウドなんてリスクいっぱいと思うけど。

失敗事例


2013年、公募によるあるイベントを開催した。審査員として外部の方、5名ほどの方が当社システムのアクセスすることになったので、id・パスワードでログインする彼ら用の専用ページを開設した。

イベント終了後、このページは削除されたが、なぜか残っていることに本日気づく。しかも認証が効いていない。全員が入れるページになっていた。サイトの移動やファイルの削除などで不意にオープンになったものと思われる。

当時は.htaccess .htpasswdによる簡易認証をかけていたと思うが、いまとなっては思い出せない。

・・・こういうことがあるので、個人情報・社内情報などをネットにアップすることは危険と再認識した。

今回はセーフだが、いつかはやる


今回は外部審査員の個人名が記載されていたExcelファイルが含まれていた。彼らはFacebookやネット活動で氏名を公開している人がほとんど。

また、内容は純粋に個人名だけなので、特に問題はないが、念のためネット検索しても、このページは検索されなかった。幸いどこからもリンクを張らなかったことで、Googleのクローラーが来れなかったと推測される。

ネットセキュリティの鉄則


リンクを張らず、認証システムにしておけば確かに、そんなに必死こいて認証を突破しようなんていう酔狂な人間はないはずだが、問題は時間がたてばシステム的にも運用的にも当初のルールは忘れ去られ、体制は変化し、砂に埋もれた隠し物が、自然の風雨でそのうち露呈するかのように出てくるという現実。

そもそもネットにアップする行為自体がリスク。「いつかは露呈しても問題ない物」だけにしておかないと、情報流失は避けがたい。ネットセキュリティの鉄則と心得るべし。






< | >

シンプル軽量CMS、Droppletsを試す
  • (2015-01-02 10:02:09)
シンプルなCMSを求めて今までいろいろ試してきたが「これで決まり!」というものに出会えない。

耽ると1日をムダにするリスク


今日は以前のコンテンツのアップデート中に今風のデザインにしたいと思い立ち、新しいCMSの導入に色気づいて、またまた調べてみるとに耽った。 → これ、案外、最悪のパターン。やり出すと半日や1日はすぐに消費する。今日も、結果的に無駄にした。

Dropplets


数点、試した中、DroppletsというCMSがシンプルさ、見た目ともによかったので導入してみた。日本語で解説してくれている人も何人かいて、これは簡単そうーとやってみるとそうでもない。

ダウンロード → アップロード → 完了とのことだが、インストールのためにブラウザでアクセスすると最初のパスワード入力画面だけはでるが、その次の画面は「500番エラー」となる。

phpのバージョンを変えたり設定を変えたり、WAFの設定を変えたり、パーミッションを変えたり、いろいろしたが、ロリポップとは相性が悪い?海外のどこかのサイトに、htaccessファイルから次の行を削除せよとあった。

Options +FollowSymLinks -MultiViews

これでとりあえず動いたが、日本語文字化け、記事順の変更方法、フォントの変更方法、mdファイル(markdown形式)がどのようにhtmlファイルに変換されるのかわからなくて、時間切れ。

全然簡単でなかった。

結論はphpを使えなきゃ、厳しい


phpを多少書けないと、こういう製品は使いこなせないようだ。

本当の結論


もっと言えば、話は簡単。今まで何十もCMSを試してきたが、最終的に不満なものしかない。結局、自分で作らないとダメなようだ。ある程度好みのものを見つけたら、そこをベースに作り直すしかあるまい。phpを使えない自分の場合はプロさんに開発依頼をするしかあるまいという結論。






< | >

MS Word から html 変換
  • (2014-12-30 05:50:32)
Wordにはhtmlに変換する機能が付いているが、これがひどくお役所的な変換。形式的なコードがゴミのように吐き出されて、とても使えない(これはWord2003の話、その後のバージョンは不明)

Wordをhtmlに変換するネットサービス


ということで、探すとlifehackerが取り上げていてくれた。このサイト、Wordを非常にシンプルなhtmlに変換してくれる。

http://word2cleanhtml.com/

すごいの一言。BelgiumのOlly Copeさんという方がプライベートに提供しているサービスとのこと。目的などはよくわからない。

フォントなどの装飾データは失われる


ただし、フォントやカラーなど、装飾の多くは無視される仕様とのこと。

Most formatting information is stripped out, leaving just the content and the structure (headings, paragraphs, lists etc). This is intentional. The way Word adds font and colour information is generally not appropriate for web or ebook publishing.

説明によると、中身と構造だけを変換しているので、装飾は意図的に無視するとある。欲しければ自分でスタイルシートで作れとのこと。

シンプルでポリシーが明快で、わかりやすく好感が持てるサービス。






< | >

ドメインの統廃合、サイト引っ越し
  • (2014-12-26 10:57:28)

能力・モチベーション以上の数量


多数のドメインを所有していた時期は2010年から2012年だろうか。最盛期は30ドメインくらい管理していた。

主にSEO対策として専門サイトを建ててターゲットのサイトにリンクを張る施策を行っていた。しかし、現実はコンテンツをブラッシュアップする時間も体力もなく、多くは放置状態だった。

時代とともに激変するSEO対策


上記のような対策でSEO対策の効果が上がった話はすでに過去のものとなり、また、現実運用できない数量のドメインを所有していても意味がないので、ドメインの統廃合を行っている。

引越方法 事前準備


(1) web master toolにてサイト登録その他設定変更

(2) コンテンツの更新を頻繁に行いクローラーの訪問頻度上昇を誘発する

(3) サイトマップの作成とgoogleへの登録

・web master toolからサイトアップをgoogleに登録

・Xml-Sitemaps.comでサイトアップを作成・ダウンロード
 https://www.xml-sitemaps.com/

・生成されたサイトマップをftpでアップ

・web master toolにログイン
 各サイトの管理画面から
 「クロール」 → 「サイトマップ」 → 「サイトマップの追加/テスト」

引越方法 実施



(1) 全html・htmファイルに301リダイレクトを記述
 (Devasにて、正規表現「.+」で検索し、下記のリダイレクトhtml文で全置換)

<<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"><<HTML lang=ja><<head>
<<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
<<meta http-equiv="refresh" content="0;url=http://www.mydomain.net/damaskrose/">
<<meta name="description" content="引越しました">
<<meta content="2014/Dec/24" name=build>
<<title>moved<</title>
<</head><<body>

引越しました

<</body><</html>

(2) web master toolにて、引越を通知する
※「引越前ドメイン」および「引越先ドメイン」はともに登録済みであること
・引越前ドメインを選択
・その設定(歯車アイコン・歯車ボタン)
・「アドレス変更」
・「リストから新しいサイトを選択する」 → 「301 リダイレクトが正常に動作していることを確認する」ここでアウト。なぜか動作しない。






search
layout
admin

[▲page top]