並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 54件

新着順 人気順

mntsqの検索結果1 - 40 件 / 54件

タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。

mntsqに関するエントリは54件あります。 プログラミングpython開発 などが関連タグです。 人気エントリには 『もし「リーダブルコード」を弁護士が読んだら? - MNTSQ Techブログ』などがあります。
  • もし「リーダブルコード」を弁護士が読んだら? - MNTSQ Techブログ

    こんにちは。「リーダブルコード」を先月読破して、感銘を受けた弁護士の人です。 なにに感銘を受けたかというと、「エンジニアが高級言語を効率的にコーディングするための工夫」は、契約という言語をコーディングするために援用できることがとても多いということです。 例えば、リーダブルコードは「関数には空虚な名前(tmpとかretvalとか)でなく、エンティティの実体に即した名前をつけよう!」と提案しています。 これめっちゃわかります!!!なぜなら、契約言語では当事者というクラスの表現のために「甲」「乙」という定義を未だに使います。そして、甲と乙を逆に書いてしまったままReviewを通過することが実際によくあります。オライリーさんには激怒されるでしょう。 しかし、よく考えると高級言語と契約言語が似ているのは当然だと思うようになりました。それは、どちらも「一定のインプットを入れると、必ず一定のアウトプット

      もし「リーダブルコード」を弁護士が読んだら? - MNTSQ Techブログ
    • Ubuntu を業務PCで使いつづけて3年が経ちました。 〜Web開発にmacOSじゃなくて大丈夫なのか気になる方へ〜 - MNTSQ Techブログ

      MNTSQ(モンテスキュー)株式会社 ソフトウェアエンジニアの沼井です。 普段はRailsでのバックエンド開発をしつつ、Elasticsearchによる全文検索処理やインデクシングまわりの開発にも取り組んでいます。 私は現在、 Thinkpad X1 Carbon (2021年版)にUbuntu 20.04をインストールして開発を行なっています。MNTSQ社以前の経験も含めると、業務でのUbuntu使用経験は3年以上あります。 テック系スタートアップの、とりわけWebサービス・スマホアプリの開発シーンでは、macOSユーザーが99%(※個人の感想です)ということもあり、macOS以外の環境を(使いたくても)使うことが難しいと思っている人も多いと思います。 本記事では、業務でのUbuntu利用の実情・課題・メリットなどを共有したいと思います。 TL; DR テック系スタートアップにおけるソフ

        Ubuntu を業務PCで使いつづけて3年が経ちました。 〜Web開発にmacOSじゃなくて大丈夫なのか気になる方へ〜 - MNTSQ Techブログ
      • ヘルプデスク業務を楽にするためにSlackとGitHub Projectを同期するヘルプデスクツールを自作した - MNTSQ Techブログ

        こんにちは。MNTSQの下村です。 コーポレートエンジニアとして、MNTSQ従業員の生産系向上施策等を実施していたりします。 Twitterもやっているのでフォローしてもらえると嬉しいです! こんなアイコンです 本日は社員からの問い合わせ業務 いわゆる ヘルプデスク業務について効率化するためのツールを自作した 話を書いてみます。 この記事の要約 一人目コーポレートエンジニアとして参画したがヘルプデスク業務が非効率だったので効率化した。 質問に対して特定のemojiを押すとGitHub ProjectsのItemを作成するようにした。 SlackスレッドのコメントとGitHub ProjectsのItemを双方向同期するようにした。 Azure OpenAIも利用して効率化した。 きっかけ 2023年5月からMNTSQの一人目コーポレートエンジニアとして参画しています。 情報システムを色々と

          ヘルプデスク業務を楽にするためにSlackとGitHub Projectを同期するヘルプデスクツールを自作した - MNTSQ Techブログ
        • Pythonで省メモリに大量の文字列を扱う工夫 - MNTSQ Techブログ

          たくさんの文字列(や離散的な符号列)をメモリに載せないといけないんだけど、いろんな制約があって通常のList[str]では載らない…ということありませんか?(まぁあんまりなさそうですね) たまたまそういうことがあったので、その際に検討した内容をまとめておきます TL;DR メモリをもっと増やしましょう 富豪的に解決できるならいつでもそれが最高です しかし、世の中それでなんとかならんこともたくさんあります 用途があうのであれば専用のデータ構造を採用する 例えばもし共通のprefixやsuffixが存在し、順序に興味がなければtrie treeなどが使えます 例えば、弊社であれば、法人名をメモリに持ちたいなんてときもあります。そういうときに法人名の辞書をtrieで持ったりすることがあります 「株式会社」「一般財団法人」や「銀行」といった共通語がたくさんでてくるのでtrie treeでごりごり削

            Pythonで省メモリに大量の文字列を扱う工夫 - MNTSQ Techブログ
          • もし「GitHub Copilot」を現役弁護士が使ったら? - MNTSQ Techブログ

            こんにちは。GitHub Copilotを先日初めて触って、感銘を受けたMNTSQ代表の板谷です。MNTSQの代表をしておりますが、現役の弁護士でもあります。 なぜ私が、GitHub Copilotに感銘を受けたかというと、「プログラミングの LLM による進化」は、契約という言語をコーディングするためにもドンピシャで使えそうだと感じたからです。 例えば、GitHub Copilot では、自分の過去のコードを参照して、最適なコードをサジェストしてくれます。 これは、契約に関わるすべてのビジネスパーソンが求めていたものです!契約の 99.9%が過去のコードの使い回しであるにもかかわらず、毎回ゼロからコーディングするのが本当に苦痛だからです。ちなみに、前回契約と理由なく diff があると取引先に怒られます。笑 しかし、GitHub Copilot 的なものがプログラミング言語だけでなく契約

              もし「GitHub Copilot」を現役弁護士が使ったら? - MNTSQ Techブログ
            • チーム内勉強会の進め方事例 - MNTSQ Techブログ

              おはようございます!こんにちは!場合によってはこんばんわ! SREチームマネージャーの藤原です。 今年の3月からSREチームの中で、勉強会を定期的に実施するようになりました。 本エントリでは勉強会を開催するにあたって考えたことと、実際の進め方についての事例解説です。 勉強会を通じて実現したいことの説明から、テーマ設定、効果最大化のための開催形態と頻度、現時点(2024/4・5時点)の結果について解説しています。 勉強会を通じて実現したいこと チーム内勉強会を通じて実現したいこととして、以下を設定していました。 チーム・個人としてのレベルアップ 積極的な議論への参加 相互理解 チームとしての目線合わせ 勉強会を開催するからには何かしらのスキルや考え方を身に付けたいはずです。 また、学習効果を最大化するためにも、積極的な議論への参加を実現したいと考えました。 さらには、勉強会の中での議論を通じ

                チーム内勉強会の進め方事例 - MNTSQ Techブログ
              • GitLab的ドキュメント文化を組織にインストールする(実践編:スタートアップMNTSQの事例)|Anno Takahiro

                会社組織にドキュメント文化をインストールすることの有用性や、GitLabのような企業がどのようにドキュメントを運用しているかを、前回記事で書いた(スケールする組織を支えるドキュメンテーションの技術を”GitLab Handbook”から学ぶ)。今回は、私のいるスタートアップのMNTSQ(モンテスキュー、と読みます)でどのようにそれを実践しているか、実際のところどのような成果が出ているのかについて書いてみたい。 MNTSQでは、当初からドキュメンテーションの重要性を経営メンバー全員で認識しており、社内ドキュメントをGitHub管理でメンテナンスしながら作り上げていくようにしていた。この大枠の仕組みの設計部分は弊社のデザイナーの生谷(@ikutani41)が初期に考案/メンテしたものである。デザイナー視点からこのような仕組みが設計され稼働されることは珍しいと思う。この辺については本人からもどう

                  GitLab的ドキュメント文化を組織にインストールする(実践編:スタートアップMNTSQの事例)|Anno Takahiro
                • 公開されている日本の企業名辞書の紹介 - MNTSQ Techブログ

                  特許・契約書・有価証券報告書・企業関連ニュースなど、実応用上の自然言語処理では、会社名を認識したいという場面に非常に多く出くわす。 会社名らしい文字列をテキストから抽出することは、形態素解析器の辞書を用いたり固有表現抽出モデルを学習することである程度実現される一方で、抽出した会社名をレコード化して分析などに用いる際には、いわゆる名寄せの問題が発生する。 自然言語処理における名寄せに似た問題は、エンティティリンキングや共参照解析といったアプローチで探求されており、実応用上は前者のアプローチが採られることが多い印象がある。*1 名寄せタスクをエンティティリンキング的に解くためには、帰着先の知識ベース・辞書が予め存在していることが必要だが、研究の文脈では知識ベースとしてWikipediaが採用されることが多い。 Wikipediaを用いる利点は多くあり、様々なエンティティ種に対してそこそこのカバ

                    公開されている日本の企業名辞書の紹介 - MNTSQ Techブログ
                  • 101回目のDocker入門 - Techブログ - MNTSQ, Ltd.

                    あなたはDockerに何回入門しただろうか? 何度あのクジラを見て頭を抱えたことだろうか? 今回あなたを「とりあえずDockerを使ってワールドプレスを表示する」ところまで道案内しようと思う。 そう、夢はでっかく世界に羽ばたかないとね。 間違えた、ワードプレスだ。 Dockerって何 ワードプレスって何 Dockerでワードプレスを動かす ダウンロード インストール Windows macOS Dockerを起動する Windows macOS ワードプレスの設定ファイルを作る テキストエディタを開く Windows macOS 設定を貼り付ける 設定ファイルを保存する Windows macOS ワードプレスを動かす Windows macOS ワードプレスを表示してみよう 注意事項 ワードプレスを止める おわり 仲間募集中! この記事を書いた人 Dockerって何 「仮想化かーそうかー

                      101回目のDocker入門 - Techブログ - MNTSQ, Ltd.
                    • JuliaとPythonを併用したデータ処理のススメ - MNTSQ Techブログ

                      Pythonでデータ処理をしている際、numpyにはまらないごちゃごちゃした前処理があり、ちょっと遅いんだよなぁ。。。となること、ないでしょうか。 ルーチンになっている解析であれば高速化を頑張る意味がありそうですが、新しい解析を試行錯誤している最中など、わざわざ高速化のためのコードをガリガリ書いていくのは辛いぐらいのフェーズ、ないでしょうか。 こんなとき、私はJuliaを使っています。Juliaは特別な書き方をしなくても高速になる場合が多く、並列処理も簡単にできます。 julialang.org Julia、いいらしいが名前は聞いたことがあるけど使うまでには至ってない、という方がと思います。今まで使っているコードの資産を書き直すのは嫌ですよね。 しかし、JuliaにはPythonの資産を活かしつつ高速にデータ処理がするための道具がそろっています。 今回の記事はPythonとJuliaをいっ

                        JuliaとPythonを併用したデータ処理のススメ - MNTSQ Techブログ
                      • 身近なデータで30分クッキング:Google Meetのログを解析してみる編 - MNTSQ Techブログ

                        最近、身近なスモールデータをさくっと分析してみる機会があったので、過程をまとめてみました。スモールデータの解析であっても、前処理、可視化、示唆出しなどデータ分析に必要な所作というのは変わりません。ステップに分けながら紹介したいと思います。 今回はツールにGoogle Spreadsheetしか使っていないので、ノンエンジニアのビジネスサイドの人であっても同じ分析を回すことができます。Google Workspace(Gsuite)を使っている企業であれば紹介した生データも取得ができるかと思いますし、30分くらいしかかからないので、試してみると面白いかもしれません。 今回取扱いたいデータはGoogle Meetのログデータです。COVIDの影響で営業や採用文脈でリモートMTGが増えました。「最近、リモートMTGのちょっとした遅刻、多くない?」という社内のふとした問題提起から、実際にログをみる

                          身近なデータで30分クッキング:Google Meetのログを解析してみる編 - MNTSQ Techブログ
                        • pythonの依存関係解析ツール、pydepsを使う - MNTSQ Techブログ

                          はじめに 皆様はpythonで書かれたソフトウェアのリアーキテクティング1をどのように進めていますでしょうか? 既存のソフトウェアに新規機能が追加しにくいとか、機能が修正しにくい等の問題がある場合にリアーキテクティングは有効です。 リアーキテクティングの初手としては既存のソフトウェアが抱える課題の洗い出しが行われます。その際にソフトウェア内のモジュール同士の依存関係を図で把握したい場面があります。 モジュール同士の依存関係が図示されていれば、モジュール同士の構造上の問題点を伝えやすくなり、かつモジュール同士の関係を将来的にどのように落としていくかも議論しやすくなります。 このような用途に用いるpython用の依存関係解析ツールとして、今回はpydepsを紹介します。 pydeps.readthedocs.io なお、本記事で扱うコードは下記にアップロードしてあります。 GitHub - U

                            pythonの依存関係解析ツール、pydepsを使う - MNTSQ Techブログ
                          • Transformersを用いた固有表現抽出のtips - MNTSQ Techブログ

                            TL;DR TransformersのNERではFast Tokenizerを使うことで、サブトークン ↔ ラベルのアラインメントが実装できる。 長いテキスト入力については、無駄なpaddingを最小限にとどめて高速処理するために、入力を固定長分割するのが良い。 検出漏れが問題になるようであれば、ストライド付きのwindow処理を追加するのが良い。 サンプル実装: github.com 背景 この記事を目に留めていただいた方にはおそらくおなじみであろう Hugging Face の Transformers *1。 BERT等のTransformer素子ベース事前学習モデルを用いた転移学習が容易に実験できるライブラリである。 最新モデルのモジュールがすごいスピードで実装されることに加えて、事前学習モデルおよび依存するトークナイザが一緒に管理・ダウンロードできる点がご利益として特に大きい。

                              Transformersを用いた固有表現抽出のtips - MNTSQ Techブログ
                            • python3.8 から新しく導入された Literal types について - MNTSQ Techブログ

                              はじめに pythonの関数に与える引数として特定の値のみを許容したいときはないでしょうか? そのようなときに、動的に引数の値をチェックして範囲外のものを除外するアサーションや、Enumを用いてとりうる値を絞ることが考えられます。 ですが、前者は動的な値検査しか行えず、後者についてはAPIの引数の型をEnumに変更する必要があり、Enumが既存のAPIをオーバーロードしたときの引数の型として使えるとは限らないです。1 このような引数の値のチェックに使える手段として、python3.8から使えるようになっているLiteral typesがあります。 Literal types は型として宣言することで、関数の引数等に対して特定の型を要求するのと同時に、特定の値を持つことも要求できます。 例 次のようなコードの例を考えてみます。 target_fruit = ['apple', 'banana

                                python3.8 から新しく導入された Literal types について - MNTSQ Techブログ
                              • MNTSQ社の開発環境のご紹介|y_n_m

                                MNTSQ社でソフトウェアエンジニアをやっております西村と申します。 弊noteへのご来訪まことにありがとうございます。 本日は弊社の開発環境をご紹介いたします。 開発言語弊社では基盤部分をRuby on Railsで開発しております。一部、OCR処理は都合でJavaを利用したり、機械学習はPythonが得意ですのでPythonを利用しております。 レビュー環境 リリースブランチや開発ブランチへの直接プッシュは禁止しております。GitHubでブランチを保護する方法につきましては、以下の記事などをご参考ください。 [GitHub] ブランチの保護設定を活用しよう 【レビューが通るまでマージさせんぞ】 | Developers.IO リリースブランチや開発ブランチに変更を加えるには、Pull Requestを介して行います。Pull Requestのレビューは必須となっており、少なくとも一名が

                                  MNTSQ社の開発環境のご紹介|y_n_m
                                • 差分指向テスト(DOT: Difference Oriented Testing)という考え方 - MNTSQ Techブログ

                                  はじめに MNTSQ(モンテスキュー)株式会社 フロントエンド担当の安積です。 入社して4ヶ月とちょっと。 コードに取り組もうと入社して、まさに日々格闘しております。 私の後ろの席にはこんなバズ記事書く人や、こんなイカつい記事書く人が座ってまして、そんなプレッシャー期待の中からお送りいたします。 tech.mntsq.co.jp tech.mntsq.co.jp 昨日はこんな記事も公開されています。 tech.mntsq.co.jp はじめに 現在のステータス またはMNTSQ考古学 リファクタリングやるぜっっ! 仕様書大事だよね 差分指向テストとは テスト環境の概要 テストデータ ブラウザ操作自動化 スクリーンショット比較 Playwriteの操作 ちょっとコードのサンプル 最後に この記事を書いた人 現在のステータス またはMNTSQ考古学 コードベースから見たMNTSQのフロントエン

                                    差分指向テスト(DOT: Difference Oriented Testing)という考え方 - MNTSQ Techブログ
                                  • 専門知で深まる自然言語処理を求めて | MNTSQ, Ltd.

                                    これまでの経歴5月からMNTSQにジョインしました、自然言語処理エンジニアの稲村と申します。自然言語処理自体には昔から関心があり、大学院では日本語データセットの自動作成をテーマに比較的基礎寄りの研究をしていました。研究の道には進みませんでしたが、自然言語処理技術を深く理解して使えるようになりたいという想いがあったため、学生時代に十分に取り組めなかった自然言語処理の応用に関われそうな会社にこれまでお世話になってきました。働き始めてから3年目になりますが、振り返ってみると、新卒当初に意識していた機械学習エンジニアやデータエンジニアと呼ばれるシステム開発寄りのキャリアというよりも、自然言語処理に軸足を置いて、最新の研究で得られた成果の検証・導入や、古典的な手法も視野に入れた技術応用の探索がやってきたことの中心となっています。 前職はMNTSQの関連会社である、株式会社PKSHA Technolo

                                      専門知で深まる自然言語処理を求めて | MNTSQ, Ltd.
                                    • MNTSQの契約書解析を支える技術|Yotaro Katayama

                                      こんにちは!リーガルテックベンチャーのMNTSQの取締役をしている堅山と申します。 面接等で、そもそもリーガルテックってどんなタスクを解いているの?という疑問をいただくことが多いです。今回は、前回の記事に続き、MNTSQでどのような問題に取り組んでいるかを書こうと思います。 MNTSQでは、法律事務所向けに「法務デューデリジェンス」という業務を効率化するプロダクトを作っています。法務デューデリジェンスとは、M&Aなどをするにあたって、対象となる会社のリスクを法的な面から評価する作業です。具体的には会社の結んでいる契約書などの法的な効果を持つ書類をまるっと読み込んでリスクである内容をまとめていきます。ほとんどの契約書は紙で締結されていますので、これらをスキャンしてもらい、主にPDFなどでデータを受領します。ある程度のサイズの会社であればドキュメントの数は数千に達し、負荷のかかる作業です。多く

                                        MNTSQの契約書解析を支える技術|Yotaro Katayama
                                      • 安定を求めてなぜかリーガルテックベンチャーへ | MNTSQ, Ltd.

                                        MNTSQに転職して2か月が経過しました。 冒険より安定を求める性質であり、キーボードで打った文字からは感情が伝わらないからと言って手書きで手紙を書いていた自分が、IT企業、それもリーガルテックという最先端かつ未成熟な分野に身を置くとは自分でも驚きです。 そういえばなんでこんなことになっているのか、振り返ってみます。 順を追って思えば10代から安定志向だった私は、手堅い法学部を卒業して、法律事務所に就職しました。 仕事は充実していたし人間関係にも恵まれ、このまま法律業界で生きていくつもりでしたが、 結婚相手は転勤族。結婚式の2か月後に東北への転勤辞令があり、仕事を辞めて帯同しました。 このとき専業主婦になって夫を支える覚悟を確かにしていたのですが、 自分でお金が稼げない=自分の価値に自信がなくなる残りの人生を今までのインプットの貯金で生きていくのかと思ったら、足りなさ過ぎてぞっとした何の縁

                                          安定を求めてなぜかリーガルテックベンチャーへ | MNTSQ, Ltd.
                                        • ファイルシステムとS3でのユニコード正規化の関係を調べてみた2021 - MNTSQ Techブログ

                                          こんにちは、MNTSQでSREとして勤務している中原といいます。 プライベートも含めて、技術記事は久しぶりな気がします。がんばります。 さて、さっそくですが、日本人にとって、あるいは、韓国の方や中国の方も含めて、コンピュータ上でそれぞれの国の言葉を扱おうとしたときに苦労するのが文字コードです。 かつては(あるいは今も)、Shift JIS、EUC-JPなど、OSや環境などによって使われる文字コードが異なり、相互の連携や、同じOSでも設定次第で大いに苦労したものでした(と聞いておりますし、個人でPCを楽しんでいたときには苦しんだりした記憶があります)。 そうこうしているうち、多くのOSで標準的な文字コードとしてUnicodeが採用されるようになりました。Windowsでは内部でUTF-16LEを採用しています。Linuxでは、UTF-8を標準とすることが多くなりました。 Unicodeに統一

                                            ファイルシステムとS3でのユニコード正規化の関係を調べてみた2021 - MNTSQ Techブログ
                                          • 30代なかばで、新しい世界に挑戦する理由 | MNTSQ, Ltd.

                                            2月よりMNTSQに入社しました幕内 みずきと申します。 今回は、私がどんな思いでこの会社にJoinするに至ったのかと、入社して1か月が経った今の思いを書き綴ろうと思います。 私がMNTSQに出会うまで MNTSQに入社する前は、妊娠・出産を挟みつつ、いくつかの企業で法務部に所属していました。 私は、法学部と法科大学院を出た後に、司法浪人を何年かしていましたが成就せず、なんとなく経験が生かせるかな?くらいのぼんやりとした動機で仕事を選んでいました。 私の見聞きした範囲内では、ある程度大きな組織の法務部では、「こう決まったからここ対処してね。」とか、「こうなるかもしれないからどんな事起こるか予測して対策立ててね。」といった事をトップダウンで依頼されることが多く、基本的に指示待ち、受け身の仕事になりがちです。 さらに、私が所属していたのは、その業界で知らぬ者はいない剛腕経営者が君臨する会社だっ

                                              30代なかばで、新しい世界に挑戦する理由 | MNTSQ, Ltd.
                                            • ITエンジニアとして現場で働き続けるという選択肢 | MNTSQ, Ltd.

                                              2020年3月からMNTSQ社にお邪魔している西村 悠樹です。ソフトウェアエンジニアとして働き始めました。入社時に一号社員と言われて驚きましたが、ソフトウェアエンジニアの一号社員でした。 来歴これまで、スマートフォン向けのIME開発、ウェブサイト制作、ソーシャルゲーム開発など、業界を問わず様々な会社にお邪魔しておりました。それゆえ言語などの実務経歴はちょっとおかしな事になっています。某社からは「何がやりたいのか分からない」という理由で書類選考で落とされた事もあります。これは色々実務で触ってみたかったという意図もあって、このような経歴になっています。 MNTSQ社との出会いMNTSQ社には某エージェント企業からご紹介いただきました。言語などの経歴が変に広く、業種を問わなかったため、様々な企業をご紹介いただけました。MNTSQ社はその中の1社でした。 正直申し上げると、MNTSQ社には役員4名

                                                ITエンジニアとして現場で働き続けるという選択肢 | MNTSQ, Ltd.
                                              • MNTSQからみらい翻訳に転職しました - moriyamaのエンジニアリング備忘録

                                                2020年11月末でMNTSQ株式会社を退職し、2020年12月より株式会社みらい翻訳に入社しました。 MNTSQは自然言語処理技術を主力とした法務領域向けプロダクトを展開するスタートアップです。みらい翻訳は機械翻訳プロダクトを提供している会社で、どちらも自然言語処理技術をコアとしたプロダクトを作っている会社です。 MNTSQでは、法務というドメインの固有の課題に取り組む面白さを感じていたところだったのですが、みらい翻訳での機械翻訳という自分が最も固有の価値を発揮できそうなドメインに出会い、転職を決意しました。 AI(機械学習)という季節が常に冬か春しかない業界にいて、自分がキャリアについて考える際に、よく尊敬する人たちの入社/退職エントリを参考にしました。 自分の話が誰かの役に立つことは少ないと思うものの、一例として残してみようと思います。 自分について 私のMNTSQ入社までの話は、過

                                                  MNTSQからみらい翻訳に転職しました - moriyamaのエンジニアリング備忘録
                                                • 日本語でHugging Face Tokenizersを動かす - MNTSQ Techブログ

                                                  前回記事に続いてHugging Faceネタです。Transformers本体ではなく、分かち書きを行うTokenizersライブラリの紹介をします。 Hugging Faceが開発しているTransformersでは、事前学習モデルと用いた分かち書き処理を同梱して配布している。 機械学習モデルの学習時と推論時の間で分かち書き設定が異なったり、分かち書き済み公開データと分かち書き設定が揃っていなかったりすると、モデルの挙動が正しく再現できないので、この設定が揃うように仕組みで吸収できる良いプラクティスといえる。 比較的古いバージョン*1のTransformersが用いるトークナイザは、ライブラリ内に同梱されるPython実装のものであった。 日本語で配布されているTransformersモデルの事例でいうと、例えば東北大学の乾研究室から公開されている日本語BERTモデルでは、Transfo

                                                    日本語でHugging Face Tokenizersを動かす - MNTSQ Techブログ
                                                  • 流浪の○○テックの果てのリーガルテック 〜あるエンジニアのMNTSQ入社エントリ〜 | MNTSQ, Ltd.

                                                    10月1日からMNTSQに入社して1ヶ月半が経ちました。 そういえば、このエントリが公開された翌日は、MNTSQの設立2周年の日だそうですよ。 ○○テックを渡り歩いて新卒で就職して今まで、「ITの力をIT以外の世界へ提供させること」と「自分たちが作っているその製品やサービスを、自分たちで直接顧客に届け続けること」の二つを両立できる仕事に就きたいなと考えて生きてきました。幸せなことに、おおかたそういった仕事に就いて仕事をしてきたことが多い人生のように思います。私が新卒の頃には、まだX-Techと言われる言葉はなかった(または浸透していなかった)と記憶していますが、振り返ればそういう世界観に近い感覚で生きてきたのかなと思います。 それぞれ濃淡はありますが、エンジニアとして、不動産テック、アグリテック、フィンテック、業務外のコミュニティ活動としてシビックテックに参画してきました。 そして今回、リ

                                                      流浪の○○テックの果てのリーガルテック 〜あるエンジニアのMNTSQ入社エントリ〜 | MNTSQ, Ltd.
                                                    • 代表取締役の肩書きを置いてでも「変化を選択する」という価値観とキャリア | MNTSQ, Ltd.

                                                      この投稿は、これからのキャリアを考えている方に向けてひとつの選択肢を示せればと思い、現職を選択するに至るまでの思考プロセスを備忘録として書き残したものである(3分でひとりの人生の一部を追体験できるお得な読み物です) 「長谷川さんはなんでMNTSQ(モンテスキュー)に入ったんですか?」採用面談の場で私がとにかくよく尋ねられる質問がこちらで、いつもこの質問をさせてしまってごめんなさいと思いながら、そもそも自分の自己紹介が悪いのだということを、最近ようやく自認しはじめるようになった。 いわゆる定型文的な「自己紹介しますね」のあとの、このあたりのくだりがが良くないらしい。 - 大企業向けのコンサル的なキャリアからスタートして(わかる) - 創業メンバーとして参画したスタートアップで売上10億・メンバー70名までの成長を3年で経験したあと(わかる) - 自分でも会社つくって(わかる) - なぜかMN

                                                        代表取締役の肩書きを置いてでも「変化を選択する」という価値観とキャリア | MNTSQ, Ltd.
                                                      • パラリーガルが検索エンジニアの溝口さんに聞いてみた | MNTSQ, Ltd.

                                                        MNTSQは契約に関するプロダクトを開発するリーガルテックベンチャーです。 リーガルにテックと付く以上、弊社のパラリーガル職は法律についての知識だけ持っていればよいわけではなく、機械学習×法律、検索×法律、など、他領域と自分の知識との掛け算の毎日です。 そこで、特に協働する機会の多いエンジニアさんに、パラリーガルの川上がインタビューをしてみました。 MNTSQの検索体験向上のキーパーソンです! 溝口さんの検索エンジニアとしてのお仕事についてはこちらをご覧ください。 パラリーガルという存在川上:インタビューをご快諾いただきありがとうございます! 早速ですが、今までのご経歴から、パラリーガルって全く畑違いの存在だったのではないでしょうか。一緒に働いてみてどうですか? 溝口:まずは驚かされました、みなさん吸収が早くて。 川上:あ、忖度は結構なので本音でどうぞ。 溝口:笑 いや本当に。 みなさん、

                                                          パラリーガルが検索エンジニアの溝口さんに聞いてみた | MNTSQ, Ltd.
                                                        • RubyKaigiに初めて参加する方へ届けたい、2回目参加者が送る Tips と心構え - MNTSQ Techブログ

                                                          こんにちは。 すべての合意をフェアにしたいMNTSQ(もんてすきゅー)のJessie (@Jessica_nao_) です。 仕事では、Ruby on Rails を"利用"させていただき、法務業務に利用されるSaaS Webアプリの開発を行っています。 RubyKaigi2024が間も無く開催されますね! 土日から沖縄入りされている方の投稿がTwitterに流れてきており、既に私の気持ちもかなり高まってきています✈️ この記事では、「今回RubyKaigi に初めて参加するぞ!」という方に向けて、2023年に初めてRubyKaigiに参加した私が、知っておくと嬉しいと思うTipsやRubyKaigiのあれこれをいくつか紹介していきます📝 なお、公式アナウンスは非常に重要です。オンサイト参加の方で、Onsite Information - RubyKaigi 2024 をまだご覧になって

                                                            RubyKaigiに初めて参加する方へ届けたい、2回目参加者が送る Tips と心構え - MNTSQ Techブログ
                                                          • MNTSQプロダクト開発チームのカンバン運営を紹介します!|ikutani41

                                                            リーガルテック・カンパニーMNTSQ(モンテスキュー)を創業して1年と9ヶ月が経ちました。 今日はMNTSQ(モンテスキュー)のプロダクト開発チームでは日々どんな流れで仕事が行われているのか、特にカンバン運営に焦点を当てて紹介しようと思います。 MNTSQのプロダクト開発の全体像としては、OCRやアルゴリズム開発やリーガルナレッジの再定義など様々なことをやっていますが、今回は特にユーザが触るソフトウェア面の開発(Rails + Vue.js + Elasticsearch)での運営を紹介します。 開発チーム構成 # こんな感じ ・PM & Designer & フロントエンドエンジニア: 1人(私) ・遊撃隊: 1人 ・バックエンドエンジニア: 2名 ・検索エンジニア: 1名 ・週2~3業務委託エンジニアチーム: 4名見ての通りまだまだ小さいチームです。 特に業務委託チームはフルリモートで

                                                              MNTSQプロダクト開発チームのカンバン運営を紹介します!|ikutani41
                                                            • MNTSQの機械学習エンジニアの仕事の進め方|Yotaro Katayama

                                                              こんにちは、リーガルテックのスタートアップであるMNTSQ(モンテスキューと読みます)取締役をしています堅山です。 面談等で質問を頂く機会も多かったので、これから何回かに分けて、MNTSQで機械学習エンジニアがどのように仕事をしているのかについて話していきたいと思います。 今日はまず、MNTSQで心がけている仕事の進め方の話を紹介したいと思います。 もくじ(予定) -  (今回)MNTSQの機械学習エンジニアの仕事の進め方 - 契約書解析を支える技術 - MNTSQの機械学習エンジニアの2週間MNTSQってどんな会社?リーガルテックベンチャーのMNTSQは、足元では法律事務所の法務デューディリジェンスという業務を効率化するソフトウェアをSaaSの形で提供しています。 法務デューディリジェンスは、M&Aにおいて対象企業を買収検討する際に、買収される会社の契約書を確認し、問題がないかを確認する

                                                                MNTSQの機械学習エンジニアの仕事の進め方|Yotaro Katayama
                                                              • LegalTechの2021年を展望する | MNTSQ, Ltd.

                                                                2020年はLegalTechにとっても地殻変動の年となりました。COVID-19で激動した社会が、LegalTechにも新しい役割を求め始めています。 今回のポストでは、LegalTechに去年なにが起こったのかを振り返りつつ、2021年の展望を描いてみたいと思います。 LegalTechはCOVID-19でどう変わったのかCOVID-19は、デジタル化に向けた世界の動きを加速させ、ある意味では「まだ起きるはずがなかった未来」を次々と現実のものにしました。そして、その流れの最前線にあったのが契約締結のデジタル化、つまり電子契約サービスの普及です。 弁護士ドットコム株式会社が運営する国内大手の「クラウドサイン」は、2020年10月までの1年間で導入社数が2倍に増加したことを発表しています。 もともと、契約業務は紙に依存した旧来型のオペレーションが変わらず温存されている領域です。その理由の一

                                                                  LegalTechの2021年を展望する | MNTSQ, Ltd.
                                                                • ノイズが多いテキストを対象にした正規表現を書きやすくするPythonモジュール regex - MNTSQ Techブログ

                                                                  MNTSQ(モンテスキュー)という契約書管理のSaaS製品を開発する会社で、 アルゴリズムエンジニアをしている坂本です。 契約書に書かれた情報を自動で抽出する仕組みを作っています。 概要 正規表現とはなにか 正規表現を書きにくい、中ボス的なテキストが存在する regexモジュールのFuzzy match機能を使って、楽に中ボスを倒す Fuzzy matchの使用例 裏話 実は、採用ブログも兼ねています この記事を書いた人 概要 私も非エンジニア出身であるため、Techブログではあるものの、 幅広い方に読んでいただきたいと思いました。 このブログの内容をざっくり図解すると、こんな内容を扱います。 正規表現とはなにか テキスト(=文字列)に対して、マッチさせるパターンのことです。 特定の文字を含むテキストを探すときに使います。 例えば、 テキスト1:「庭には2羽ニワトリがいる」 パターン1:「

                                                                    ノイズが多いテキストを対象にした正規表現を書きやすくするPythonモジュール regex - MNTSQ Techブログ
                                                                  • MNTSQ社の採用スライドを公開しました! | MNTSQ, Ltd.

                                                                    こんにちは。MNTSQ取締役のikutaniです。 資本業務提携も決まり、続々と新たな取り組みが始まっていく中で採用強化中の我々ですが、MNTSQに興味を持ってくださった方々のために採用スライドを公開いたしました! まだまだ始まったばかりで普段の生活とは馴染みが浅いと思われるリーガルテックのことを知っていただくために、「リーガルテックの概要」や「我々が考えていること」も厚めに紹介しています。

                                                                      MNTSQ社の採用スライドを公開しました! | MNTSQ, Ltd.
                                                                    • Elasticsearchを使ってテキストの出現単語を分析したい - MNTSQ Techブログ

                                                                      MNTSQで検索エンジニアをしている溝口です。 MNTSQのテックブログの第二回目の投稿という、非常に栄誉ある役割を仰せつかって少し戸惑っています。 MNTSQでは自然言語処理を利用して容易に大量の契約書の検索をすることができるプロダクトを作っているのですが、データ(=契約書)の量が増えるにつれて同じ条件でも検索にヒットする結果の数は多くなっていきます。 その場合、検索結果の順序を検索条件に合致している順で並ぶように改善していくのですが、その前段階として扱っているデータ全体の傾向を掴みたくなることがあります。 今回はその一環として、データの中にどういった単語(term)がどのくらい含まれているのか?というのを調べる際の話にフォーカスします。 (目的は全く異なりますが、tag cloudのためのデータを上位100件とかでなく全件取りたいというようなものだと思ってください。) MNTSQのプロ

                                                                        Elasticsearchを使ってテキストの出現単語を分析したい - MNTSQ Techブログ
                                                                      • MNTSQがMLOpsを成功させる5つのポイントを解説! | AI専門ニュースメディア AINOW

                                                                        最終更新日: 2021年12月13日 ※本稿は、MNTSQ株式会社による寄稿です。 今、機械学習の実用性が注目され、さまざまな分野で機械学習の活用可能性が広がっています。あわせて、ピンポイントではなく、幅広い分野で長期的で安定的に機械学習のモデルを開発・運用できるようにMLOpsへの注目が高まっています。 MLOpsでは、機械学習システムの開発や運用にまつわるさまざまな困難を解消するべく、機械学習システムの運用がしやすい開発基盤づくりが目指されています。一方で、このMLOpsには明確な定義はなく、さまざまな要求に応える技術がMLOpsの名の下に乱立している状況です。 この記事では、MLOpsの導入を検討する際に押さえておきたいポイントを5つに分けて紹介します。 ポイント① MLOpsを理解する|その1:DevOpsとMLOps MLOpsは、DevOpsを元にした表現で、MLOpsの多くの

                                                                          MNTSQがMLOpsを成功させる5つのポイントを解説! | AI専門ニュースメディア AINOW
                                                                        • 弁護士とリーガルテック ~ 私がMNTSQに感じた可能性 ~ | MNTSQ, Ltd.

                                                                          この度MNTSQにJOINした弁護士の野崎です。 2019年は日本におけるリーガルテック元年などと表現され、現在までに数多くの弁護士がリーガルテックプレイヤーとして登場し、次々と資金調達に成功しつつある昨今の状況ではありますが、まだまだ多くの弁護士にとってリーガルテックは聞きなれない言葉であるように思われます。弁護士でありながら、私がリーガルテック企業であるMNTSQにJOINするという選択をした理由・経緯などについて簡単にお話しようと思います。 1 経歴について私は67期の弁護士で、40名程度の弁護士を擁する東京丸の内法律事務所という法律事務所において弁護士としてのキャリアをスタートしました。同事務所では顧問先対応からM&A等まで幅広く企業法務を経験し、その他大型の民事再生や破産事件も扱いながら、ときには顧問先からの紹介等により離婚・相続や自己破産などの一般民事を扱うこともあり、弁護士と

                                                                            弁護士とリーガルテック ~ 私がMNTSQに感じた可能性 ~ | MNTSQ, Ltd.
                                                                          • リーガルテック企業に入って感じる人間の可能性 | MNTSQ, Ltd.

                                                                            はじめまして。 2020年12月にMNTSQに入社しました勘解由小路と申します。 …この名前、何と読むんだろうと思われたかもしれませんね。はい。こちら、「かでのこうじ」と読みます。なんでも日本で一番長い苗字の一つだそうです。かつて平安京にあった道の一つに勘解由小路という道があり、そこから来た名前とされています。 閑話休題。 そのような古い名前を持つ私が、最先端技術の一端であるリーガルテックに取り組む企業であるMNTSQに入社して、かれこれ2か月ほど経ちました。本稿では、目まぐるしく過ぎていったこの数か月を振り返りつつ、この会社に入ろうと思った理由や、入社数か月たった今思うことなどをお話しできればなと思います。 リーガルテックへの印象私が初めてリーガルテックという単語を耳にしたのは2019年頃だったと思います。2019年はちょうどリーガルテックという領域そのものが有名になりだした時期です。

                                                                              リーガルテック企業に入って感じる人間の可能性 | MNTSQ, Ltd.
                                                                            • ANTLRを使ってクエリパーサーを実装する - MNTSQ Techブログ

                                                                              MNTSQの溝口です。 普段からMNTSQの検索周りの開発を行っています。 MNTSQを含め、情報検索を行うモダンなアプリケーションではシンプルなUIが好まれます。 一方で、複雑な検索条件などを指定したい場合、シンプルなUIでは実現が難しいという問題があります。 その場合、シンプルなUIとは別に「詳細検索ページ」を用意するか、キーワードを入れるテキストボックスで検索式をサポートさせたりします。 今回は、直近で検索式のことを考える機会があったので、その実装手順について簡単に書こうと思います。 検索式とは 簡単に言えば、AND / OR / NOT などの論理記号と、 () での評価の優先順位の指定などです。あとは、 [フィールド名]:[キーワード] など、特定のフィールドに対するオペレーション、 ” をつかった明示的なフレーズ検索などをサポートすることもあります。 検索式を実装するに当たって

                                                                                ANTLRを使ってクエリパーサーを実装する - MNTSQ Techブログ
                                                                              • GPT時代のサバイバル戦略 - SaaSはなにを考えるべきか?|MNTSQ, Ltd.(モンテスキュー)

                                                                                こんにちは。LLMであらゆる業務をアップデートしたい板谷です。 chatGPTによる新たな体験は目を見張るばかりで、あらゆるSaaSが不可避的にアップデートを迫られています。ワクワクするような面白い挑戦が、そこかしこに転がっています。 私はもともとNLPを強みとするLegalTech企業のCEOをしていますが、最近は1日4時間はLLMのことを考えています。プロトタイプのディスカッションは毎回白熱し、これまでの数倍の価値のSaaSを作れるはずだという手ごたえを感じます。 しかし、ここではあえて「つまらない話」にフォーカスします。なぜなら、3年後の未来を想像すると、むしろ「これまでも当たり前だった話」で業務SaaSの勝負が決まっていると私は感じているためです。 AIの民主化と「つまらない話」「これまでも当たり前だった話」がより重要になる理由は、「汎用化されたLLMの登場により、アルゴリズムによ

                                                                                  GPT時代のサバイバル戦略 - SaaSはなにを考えるべきか?|MNTSQ, Ltd.(モンテスキュー)
                                                                                • 組織IssueをGitHubで管理している弊社課題の見える化実験。或いは情報爆発問題への一考 - MNTSQ Techブログ

                                                                                  組織の情報爆発 突然ですが組織で働くすべての皆さん、所属組織のルールや方針、意思決定やその背後の理由についてどの程度把握されているでしょうか?突然理由も知らされず組織ルールや方針が更新されたり、日々の仕事において必要な承認や確認の取得に時間がかかっていないでしょうか。 MNTSQでは、 (センシティブな個人情報を除いて)組織の職位やロールによらず誰もがアクセスできるようにする そのためにドキュメント駆動で意思決定や相談記録を残し、誰もが非同期でそれらにキャッチアップしながら賛否や新案を提案できる GitHubのIssue機能を介して、ゴミの分別ルールからビジョンレベルの意思決定まで誰もが発議できる などの文化を大切にしています。これらの効用については様々な発信があるので、他の記事に譲りますが、同時に次のような悩ましいトレードオフ問題に直面しています。 組織の拡大に伴って発信される情報が非線

                                                                                    組織IssueをGitHubで管理している弊社課題の見える化実験。或いは情報爆発問題への一考 - MNTSQ Techブログ

                                                                                  新着記事